web基础于http协议
时间:2023-08-03 13:37:00
目录
引言
一、DNS与域名
1.概述
2.域名申请
3.DNS解析
/etc/hosts
/etc/resolv.conf
在网卡配置文件中定义
4.域名服务和域名注册
域名
域名服务
域名注册
域名注册是Internet一种解决地址对应问题的方法是遵循先申请先注册的原则:
二、网页访问(HTTP/HTTPS)
基本概念-toc" style="margin-left:40px;">1.网页的基本概念
2.HTML
标签-toc" style="margin-left:40px;">3.网页基本标签
头部标签中常用的标签
内容标签中常用的标签
4.网页基本标签
5.标题标签类型
三、Web
1.概述
2. web1.0与web2.0
Web1.0
Web2.0
web2.0特征
小结
3.静态页面
定义
特点
4.动态页面
定义
特点
四、HTTP协议
1.概述
2.HTTP1.0和HTTP1.1之间的区别
缓存处理
使用带宽优化和网络连接
管理错误通知
Host头处理
长连接
3.HTTP 请求格式( GET / POST 方式 )
GET方式
POST请求方式
GET 与POST 区别
区别
4.三次握手和四次挥手
三次握手
四次挥手
三次握手原因
四次挥手原因
五、HTTP状态码
状态码分类
生产环境常见的HTTP状态码
六 、HTTP协议请求
1.工作原理
2.http协议请求流程分析
七、总结
引言
本章我们将详细了解有关web的基础知识,涵盖域名的概念,DNS原理以及静态动态网页的相关知识。
一、DNS与域名
1.概述
- 网络是基于TCP/IP协议进行通信和连接的,每一台主机都有一个唯一的标识(固定IP),用来区分在网络上成千上万个用户和计算机。网络在区分所有与之相连的网络和主机时,均采用一种唯一、通用的地址格式,即每一个与网络相连接的计算机和服务器都被指派一个独一无二的地址。
- 网络中的地址方案分为两套:IP 地址系统和域名地址系统,两套地址系统是一一对应的。
- 由于 IP 地址是数字标识,使用时难以记忆和书写,因此在IP地址的基础上发展出一种符号化的地址方案,来代替数字型的IP地址。
- 每个符号化的地址都与特定的 IP 地址对应,这样网络上资源访问起来就比较容易的多,这个与网络上的数字型
- IP地址相对应的字符型地址,就是域名。
2.域名申请
- 域名注册是 Internet 中用于解决地址对应问题的一种方法
- 遵循先申请先注册原则
- 域名注册步骤: 准备申请资料——》寻找域名注册网站——》查询域名——》正式申请——》申请成功。
3.DNS解析
/etc/hosts
linux系统中负责快速解析的文件,包含了ip与主机名的映射关系,在没有DNS服务器的情况下,使用本地/etc/hosts完成解析/映射,实现快速访问。
Ps:主要用于主机之间(IP和主机名)的映射/解析关系,示例:
192.168.168.128 master
192.168.168.129 node1
192.168.168.130 node2
/etc/resolv.conf
DNS客户端配置文件,主要用于设置DNS服务器的P和域名,还包含了主机域名的搜索顺序等等,这个文件是由域名解析器(resolver,一个根据主机名解析IP地址的库)使用的配置文件。
PS:主要用与匹配DNS服务器,示例:
nameserver 114.114.114.114
nameserver 8.8.8.8
在网卡配置文件中定义
/etc/ sysconfig/ network-scripts/ifcfg-ens33
DNS1=114.114.114.114
DNS2=8.8.8.8
生效顺序:1 hosts文件 2网卡配置文件3 /etc/resolv.conf
4.域名服务与域名注册
域名
定义:标识一组主机并提供它们的有关信息的树形结构(主要确定了根在哪,就可以确定每个分支)
根域:位于域名空间最顶层,一般用一个".“表示。以”.”根域为开始域名空间结构(从右往左看)根域位于域名空间最顶层,一般用一个".”表示基础单位,除了根域其他都只有一个上级域,有0或多个子域,同层域不可重复的子域或域名
顶级域:一般代表一种类型的组织机构或国家地区(主要有此两种类型构成),如net(网络公司)、com(商业)、org(民间团体组织)、edu(教育)、gov(政府)、mil(军事)、cn(中国)、jp(日本)、hk(中国香港)
二级域:也叫子域用来标明顶级域内的一个特定的组织,国家顶级域下面的二级域名由国家网络部门统一管理,如 .cn顶级域名下面设置的二级域名: .com.cn、.net.cn、 .edu.cn …
主机:主机位于域名空间最下层,就是一台具体的计算机,如
www、mail、都是具体的计算机名字,可用www.sina.com.cn.、mail.sina.com.cn、来表示,这种表示方式称为FQDN(完全合格域名),也是这台主机在域名中的全名。
域名服务
分布式,每台主机维护一个部分,保持和维护域名空间的程序,响应解析器的请求
解析端(客户端)
向DNS服务器发出请求的设备
域名注册
域名注册是Internet中用于解决地址对应问题的一种方法遵循先申请先注册原则
域名注册步骤:
- 准备申请资料
- 寻找域名注册网站
- 查询域名
- 正式申请
- 申请成功
二、网页访问(HTTP/HTTPS)
1.网页基本概念
网页
纯文本格式文件
编写语言为HTML
在用户的浏览器中被“翻译”成网页形式显示出来
网站
由一个一个页面构成的,是多个网页的结合体
主页
打开网站后出现的第一个网页称为网站主页(或首页)
域名
浏览网页时输入的网址
HTTP/HTTPS
用来传输网页的通信协议(是否加密),是一种通讯/交互的标准/规范
URL
是一种万维网寻址系统
HTML
用来编写网页的超文本标记语言
超链接
超链接是将网站中不同网页链接起来的功能
发布
将制作好的网页上传到服务器供用户访问的过程
2.HTML
HTML超文本标记语言
- Hyper Text Markup Language
- 网页的“源码”
浏览器:“解释和执行”HTML源码的工具
HTML文档的结构
- HTML网页
- 头部部分
- 标题部分
- 主体部分
- 网页内容,包括文本、图像等
示例:
阴雨天
今天小雨淅沥
3.网页基本标签
头标签中常用标签
标签 | 描述 |
定义了文档的标题 | |
定义了页面链接标签的默认链接地址 | |
定义了一个文档和外部资源之间的关系 | |
定义了 HTML 文档中的元数据 | |
定义了客户端的脚本文件 | |
定义了 HTML 文档的样式文件 |
内容标签中常用标签
标签 | 描述 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4、网页基本标签网页摘要信息的作用
5、标题标签类型
三、Web1.概述
2. web1.0与web2.0Web1.0
Web2.0
web2.0特征用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户 小结web1.0 : 只能访问网站 不能进行交互 静态页面 只能看 单向 web2.0 : 交互(论坛、淘宝) 动态页面 3.静态页面定义静态网页是标准的HTML文件 例如文本、图像、声音、Flash动画、客户端脚本和Activex控件及Java小程序等 没有后台数据库、不含程序和不可交互的网页 相对更新起来比较麻烦,适用于一般更新较少的展示型网站 特点每个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有"?" 4.动态页面定义网页URL不固定,能通过后台与用户交互 特点交互性 网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这将是今后wBB发展的大势所趋 无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量 当不同的时间,不同的人访问同一网址时会产生不同的页面 四、HTTP协议超文本传输协议是互联网上应用最为广泛都一种网络协议,所有的网页文件都必须遵守这个标准。HTTP最初的设计目的是为了提供一种发布和接受HTML页面的方法。 1.概述
两者对比:
2.HTTP1.0和HTTP1.1之间的区别缓存处理在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。 带宽优化及网络连接的使用HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接 错误通知的管理在HTTP1.1中新增了24个错误状态响应码,如409(Conflict)表示请求的资源与资源的当前状态发生冲突;410(Gone)表示服务器上的某个资源被永久性的删除 Host头处理在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request) 长连接HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点。 3.HTTP 请求格式( GET / POST 方式 )HTTP 支持几种不同的请求命令,这些命令被称为 HTTP 方法,每条 HTTP 请求报文都包含一个方法,告诉服务器要执行什么动作,包括获取一个页面、允许一个网关程序、删除一个文件等。 GET方式请求行
请求头(描述信息/标准化信息)
POST请求方式
请求头
请求体
GET 与POST 区别
区别语义上的区别
服务器请求的区别
参数放请求头和请求体的差别
4.三次握手和四次挥手三次握手
第一次握手:PC1向PC2发送请求连接(同步已发送状态) 四次挥手
第一次挥手:PC1发送FIN/ACK给PC2,表示自己要断开连接。(终止等待-1) 三次握手原因为了实现可靠数据传输, TCP 协议的通信双方, 都必须维护一个序列号, 以标识发送出去的数据包中, 哪些是已经被对方收到的。 三次握手的过程即是通信双方相互告知序列号起始值, 并确认对方已经收到了序列号起始值的必经步骤 四次挥手原因因为当 Server 端收到 Client 端的 SYN连 接请求报文后,可以直接发送SYN+ACK报文。其中ACK报文是用来应答的,SYN报文是用来同步的。但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,“你发的FIN报文我收到了”。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步握手。 五、HTTP状态码HTTP状态码是用以表示网页服务器HTTP响应状况的3位数字代码,当浏览器请求某一URL时,服务器会根据处理情况返回相应的处理状态。HTTP状态码可以分为五大类,其中2xx 3xx表示请求正常,4xx 5xx表示出现异常情况。 状态码分类
生产环境常见的HTTP状态码
六 、HTTP协议请求1.工作原理由HTTP客户端发起一个请求,建立一个到服务器指定端口(默认是80端口)的TCP连接。 连接 2.http协议请求流程分析用户输入URL(地址链接)(http://www.baidu.com:80/tools.html)客户端获取到端口及主机名后,客户端利用DNS解析域名,客户端的浏览器会先找自身的缓存,如果有解析结束,如果没有客户端会去找host文件,如果host文件没有的话,客户端会去本地的DNS缓存服务器。本地的DNS缓存服务器没有的话,缓存服务器会去找根域,根域没有,会返回一个.com,然后本地缓存器会去找顶级域,顶级域没有的话会返回baidu.com,然后本地缓存服务器会去找二级域,二级域解析完后会返回客户端。 客户端解析到IP地址后会通过TCP的三次握手与服务器建立连接。 七、总结域名空间结构 HTML文档结构 网页内容由网站内部采集发布的时web1.0,内容由使用者提供的是web2.0 POST和GET方法在缓存、安全性、长度限制等方面有区别。 HTTP协议请求响应以报文形式传递。 |