当你决定在网站上部署 LLM 友好型配置文件时,最常面对的技术选择就是:llms.txt 与 llms-full.txt 究竟有什么区别?简单来说,这是一个关于“目录”与“正文”的架构设计问题。如果你的网站结构复杂,仅靠一个简短的摘要文件(Standard)是无法满足 AI 全局理解需求的,此时必须引入完整版(Full)文件的配合。
形象化比喻:假设你在管理一个巨大的“数字图书馆”。标准版的
llms.txt 就像是放在大厅的“图书检索目录”,用几百字概括每个展厅都有什么大类。而 llms-full.txt 则是把图书馆里所有最核心、最精华的“核心典籍”直接打印成一本厚书,平铺在桌子上。AI 爬虫过来时,先看目录(Standard),如果它需要更深层的知识,就会直接翻阅这本厚书(Full),一口气吸干所有的语义上下文,而不需要在你的展厅里到处乱跑。在技术实现层面上,标准版的 llms.txt 应当保持极度的克制。它的第一部分是基础元数据(H1标题和简介),第二部分则是核心链接列表。每一项链接下方,用一行简短的文字描述该页面的主要职能。它的首要目标是降低 AI 爬虫的初始解析 Token 成本。
相反,llms-full.txt 是一个完全铺开的语义网络。它允许你使用 Markdown 的二级标题(H2)把各个子页面的真实正文、核心代码块、API 参数定义直接进行物理拼装。当 OpenAI 的 GPT-4o 或 Anthropic 的 Claude 3.5 Sonnet 访问你的站点时,这种双层架构能提供最完美的渐进式信息获取路径,从而使你的站点在新一代 AI Search(如 Perplexity)的算法权重中获得更高的技术评分。