你可能已经注意到,网站如何记住你的登录信息,或者广告如何在互联网上追踪你。这都是因为HTTP cookies。尽管它们体积小,却对用户体验和在线商业策略至关重要。但同时,它们也引发了重大的隐私问题。因此,现在是时候用网络技术术语来定义cookies,并了解它们的工作原理了。
什么是 HTTP Cookie?

HTTP Cookie 只是一个包含少量数据的文本文件。当你浏览时,你的网络浏览器会将其存储在你的计算机上。当你访问某个网站时,后者会将信息保存在 HTTP Cookie 中。稍后,它可以读取它来记住你。也就是说,下次你访问该网站时,该网站会说:“哦,我认识这个人!”并且它会根据对你的了解来定制你的体验。
让我们以网上购物为例——我们所有人(或大多数人)都会这样做。你登录后,挑选了几件商品,但随后分心并离开了网站。稍后,你回来,瞧!你的购物车和你离开时一模一样。该网站会记住你的会话。这种便利是有代价的,特别是在隐私方面,但我稍后会再谈到这一点。
主要目的

会话管理
会话在你登录网站时开始,在你注销或关闭浏览器时结束。网站会记住你的会话 ID。因此,你在浏览各个页面时仍保持登录状态。
想象一下,你正在论坛上。你登录以发表评论,然后单击阅读其他帖子。由于保存了数据,你可以保持登录状态,并且你的评论会话保持活动状态。
个性化
网站同样会记住你的偏好和设置。这可以包括语言偏好、主题设置和网站的其他可自定义元素。
例如,在新闻网站上,cookie 可能会记住你喜欢的栏目,如体育或科技。每次访问主页时,你都会在主页上看到相关文章。
追踪与分析
由于文本文件很小,网站所有者可以了解我们喜欢和不喜欢的内容。他们收集数据,进行分析,然后改进网站(理想情况下,他们就是这样做的)。
也就是说,博客可能会看到哪些文章最受欢迎。这可以很好地补充他们的SEO 策略。这可以帮助博客所有者了解读者想要阅读哪些主题,并针对这些主题撰写更多内容。
定向广告
然后,还有定向广告。我相信你们都经历过这种或那种情况。广告商跟踪我们,向我们展示定制广告。我们可以开玩笑,可以害怕,但这是现实。
安全
非常重要的是,cookie 可以增强安全性。事实上,它们存储有助于保护你的在线帐户的信息。例如,它们可能在银行等网站上存储身份验证令牌并防止未经授权的访问。
Cookie 类型

会话Cookies
这些是临时的,关闭浏览器后就会消失。顾名思义,它们会存储有关你当前网站会话的信息。这样,它们可确保你在各个页面之间移动时的连续性。
用例示例:
- 将物品保留在你的购物车中;
- 在会话期间保持在网站上登录;
- 记住表格中的临时选择或输入。
持久性Cookies
持久性(也称为存储性)Cookie 会保留在你的设备上,直到它们过期或你将其删除。它们可帮助网站记住你的信息和设置,以供将来访问。
用例示例:
- 让你在多个会话中保持登录社交媒体帐户。
- 在网站上保存你的语言偏好或主题设置。
- 记住你之前在网站上的操作或选择。
第三方Cookies
这些是由网站以外的人设置的。通常由广告商设置。目的是跟踪你的浏览习惯并投放有针对性的广告。他们可以跟踪你从一个网站到另一个网站,并根据你的兴趣建立个人资料(我知道这听起来很恐怖)。
用例示例:
- 根据你的浏览历史记录显示有针对性的广告。
- 启用跟踪用户行为的社交媒体插件。
- 为网站所有者提供分析服务。
安全Cookies
这些仅通过加密连接(HTTPS)传输,以……好吧,增强安全性。它们通常用于交易,需要特别小心地保护数据。
用例示例:
- 存储网上银行的会话信息。
- 保证电子商务网站上登录会话的安全。
- 保护在线交易过程中交换的敏感信息。
HttpOnly Cookies
JavaScript 等客户端脚本无法访问这些内容。此限制有助于防止某些类型的网络攻击,例如跨站点脚本 (XSS)。
用例示例:
- 安全存储会话 ID 以防止盗窃。
- 保护 Web 应用程序上的敏感会话信息。
- 确保身份验证令牌不易受到客户端攻击。
第一方Cookies
这些是由你当前访问的网站设置的。它们通常用于会话管理和个性化(与第三方的非常相似,但利益相关者不同)。
用例示例:
- 记住你在博客平台上的登录状态和用户偏好。
- 根据你之前的互动定制主页。
- 跟踪用户行为以提高网站功能。
HTTP Cookies:优点和缺点

优点
一方面,存储会话数据使浏览变得更容易。记住登录详细信息、保存购物车、保留语言偏好 — — 所有这些都很有用且方便。企业也喜欢它们。网上银行、购物网站 — — 它们都依赖这些小文本文件来保持你的登录状态和会话安全。
我们不要忘记个性化营销。它跟踪用户行为,这意味着广告会根据你的兴趣量身定制(更相关的广告,更好的用户体验)。网站所有者可以通过分析了解用户喜欢什么和不喜欢什么。总的来说,这一切都是为了让事情变得更顺畅。
缺点
但是(总有一个但是),网络 cookie 也有缺点。首先当然是隐私问题。这些文本文件会记录你的一举一动。它们真的会让你感觉自己被监视了。
然后是安全性。小文件经常成为跨站点脚本 (XSS) 和会话劫持等网络攻击的目标。这意味着你的数据也是攻击目标。
管理 HTTP Cookie:实用技巧

- 定期清除数据
这有助于保护你的隐私。此外,存储的数据会随着时间的推移而积累,从而降低浏览器的速度。在大多数浏览器中,你可以通过设置菜单清除网络 cookie。养成习惯,也许每月一次或在访问你不信任的网站后。
- 考虑使用隐私浏览模式
隐私浏览模式会在你关闭会话后删除网站数据。如果你不想留下任何痕迹,此功能非常有用。但请记住,这不会让你在网上匿名。
- 安装浏览器扩展
扩展程序可以让你更精确地控制网络 Cookie,并可以阻止不需要的脚本。只需在浏览器的扩展程序商店中搜索它们,然后单击“添加到 Chrome”(或你的浏览器)。它们至少有助于减少跟踪。
- 使用代理
代理可以掩盖你的 IP 地址。它们使网站更难根据你的位置跟踪你。有许多可用的代理服务,既有免费的也有付费的。你可以查看我最近选择的2024 年顶级代理服务,以找到合适的服务。
要使用代理,你可以在浏览器设置中手动配置它。或者你可以使用代理扩展。我宁愿选择后者,因为它更简单。
- 设置站点特定的 Cookie 偏好设置
有时你只想让某些网站记住你。如果是这样,最好设置特定于网站的 Cookie 偏好设置。在浏览器设置中,你可以将网站添加到“允许”或“阻止”列表中。
最终思考
总的来说,虽然cookies让网络变得便利,但它们也为隐私侵犯和安全风险打开了大门。我认为,这是一种权衡。这正是了解它们如何工作以及如何明智地管理它们如此重要的原因。
常见问题
计算机术语中的cookies是什么?
它们是文本文件,包含在你浏览网站时由浏览器存储在计算机上的数据。它们帮助网站记住你访问的信息。
网络上的cookie风险是什么?
网络cookies可以追踪你在多个网站上的浏览习惯,并广泛收集你的数据。如果它们没有得到妥善保护,你的数据可能会成为网络攻击的目标。
可以在网络爬虫中使用HTTP cookies吗?
可以,它们常用于网络爬虫中,以维持会话、绕过反爬虫机制、管理速率限制、处理验证码以及个性化数据提取。
HTTP cookie头何时以及如何发送到网络服务器?
每当你的浏览器向服务器发出请求时,例如加载网页时,cookie会被发送到网络服务器。
如何制作网络cookies?
要创建网络cookies,通常使用JavaScript、PHP或Python等服务器端脚本语言。