
1.2 HTML发展历程
HTML是一种文本类、由浏览器解释执行的标签语言,用于编写要通过WWW显示的超文本文件,具有平台无关性。
HTML诞生于20世纪90年代,由Tim Berners-Lee所设计。最初的HTML被设计得很简单,只包含几个标签,主要用于在网上展现文本。随着Web网络的迅速发展,人们开始希望在网上发布的信息图文并茂,并且动感十足。为满足人们不断增加的需要,HTML被不断地发展,其标签不断被充实,功能也得到了不断增强。至今,HTML已发展到了HTML5。在HTML5之前的HTML的最高版本是HTML4.0.1,现在说的HTML通常就是指HTML4.0.1。在这个版本的语言中,规范更加统一,浏览器之间的兼容性也更强了。
虽然HTML目前的功能已得到了极大的增强,不同浏览器之间的兼容性也更加好了,但HTML本身存在致命的缺点,就是不能描述数据的具体含义,同时它的标签也是很有限的,这就使得HTML的发展比较有限。另外在HTML的整个发展历程中,各种浏览器厂商对HTML的支持并没有完全严格按规范要求来做,使得HTML显得极其宽松,比如双标签可以没有结束标签,标签和属性的大小写不约束,属性值是否有引号都没关系,标签是否正确嵌套也没关系。而运行在计算机上的各种浏览器对错误的HTML也极其宽容,以至于明显格式不良的HTML文档在浏览器上竟然也能正确显示结果。随着技术的发展,浏览器不仅能在计算机上运行,而且还能在移动设备和手持设备上运行,而运行在这些设备上的浏览器对HTML的错误就没有那么宽容了。为此,W3C建议使用可扩展标签语言(ExtensibleMarkupLanguage,XML)规范来约束HTML文档。
XML是一套用来定义语义标签的规则,没有固定的标签,在XML中,程序员可以根据需要定义不同的标签。XML是区分大小写的,所有元素必须成对出现,所有属性值必须用英文引号引起来。XML的主要用途:一是作为定义各种实例标签语言标准的元标签;二是作为Web数据的标准交换语言,起到描述交换数据的作用。
XML作为Web数据的标准交换语言,具有很强的数据转换功能,完全可以替代HTML。但目前存在成千上万的基于HTML语言设计的网站,因此马上采用XML还不太合适。为从HTML平滑过渡到XML,而采用了可扩展HTML(ExtensibleHypertextMarkupLanguage,XHTML)。XHTML是一个过渡技术,它同时结合了HTML的简单性和XML的规范性等优点,是一种增强了的HTML。2000年1月,W3C发布了XHTML 1.0版本。
虽然HTML看上去显得很不规范,但事实上,W3C将它以及XHTML作为标准来发布时,都通过文档类型定义(DocumentTypeDefinition,DTD)对它们制定了严格的规范标准,但现在大量存在互联网上的HTML文档却很少完全遵守这些规范。出于“存在即是合理”的考虑,Web超文本应用技术工作组(WebHypertextApplicationTechnologyWorkingGroup,WHATWG)组织制定了HTML5这样一个新的HTML标准,这是一种由规范向现实“妥协”的规范。HTML5的规范极其宽松,甚至不用提供DTD。在WHATWG的努力下,W3C在2008年终于认可了HTML5,2014年10月28日,W3C的HTML工作组正式发布了HTML5的正式推荐标准(W3C Recommendation)。HTML5增加了支持Web应用开发者的许多新特性,以及更符合开发者使用习惯的新元素,并重点关注定义清晰的、一致的准则,以确保Web应用和内容在不同浏览器中的互操作性。HTML5带来了一组新的用户体验,如Web的音频和视频不再需要插件,通过Canvas更灵活地完成图像绘制,而不必考虑屏幕的分辨率,浏览器对可扩展矢量图(SVG)和数学标签语言(MathML)的本地支持等。HTML5是构建开放Web平台的核心,为此,各大浏览器厂商都对HTML5抱着极大的热情,纷纷在自己的浏览器中对HTML5提供越来越高的支持。在Web开发界,它也得到了越来越多开发人员的青睐,事实上,Google在很多地方都开始使用HTML5。