爬虫基础之HTML篇

在上一篇我提到了,我在纠结是继续学习机器学习还是学习爬虫,在经过一短时间的考虑以后,还是觉得可能先做爬虫比较容易出成绩,且更有兴趣吧。所以我决定先学习爬虫。也希望能够通过爬虫快速的爬取一些自己想要的东西。

本次学习的内容来自

HTML 简介_w3cschoolwww.w3cschool.cn图标

有兴趣的可以去看一下。我还参考了自己之前报的一个爬虫课程。(大部分都是。。。)

首先申明本人没有一点的基础,纯小白,所以肯定会有很多理解不到位的地方,在这里再次强调一下,自己写这个专栏的目的是为了,通过写专栏的方式倒逼自己学习。虽不求能通过写这种文章赚钱,但是您的点赞和推荐是我最大的动力!谢谢!

好的话不多说。让我们开始吧!

首先要理解什么是HTML :


爬虫基础之HTML篇

正如上图介绍的,HTML是一个网页中的标准标记语言。全称是Hyper Text Makeup language.简单来说就是网页的设计要遵循这个规则。就像sql语言是所有数据查询语言的基础一样(SQL became astandardof theAmerican National Standards Institute(ANSI) in 1986, and of theInternational Organization for Standardization(ISO) in 1987 –from wikipedia)

而HTML5是最新的标准。而一个网站的界面的显示也通常由HTML结合CSS(Cascading Style Sheets)和现在非常流行的JavaScript一起组成。

最基础的结构如下


html>
head>
title>Page Titletitle>
head>
body>

h1>This is a Headingh1>
p>This is a paragraph.p>

body>
html>

这个执行结果如下


爬虫基础之HTML篇

这里要介绍一下上述的编码代表的含义

标签基本格式:文件内容标签名>

:用于代码开头指定html版本等信息

html>

原创文章,作者:江山画,如若转载,请注明出处:http://wpbbw.com/4197.html

发表评论

登录后才能评论