事情起因
DS的爆火,引发群民AI搜索热潮,各大厂商开始纷纷接入DS大模型。老板们在家坐不住了,问员工:为什么AI搜索推荐没有我们家的产品信息,推荐的都是同行竞品的产品?
来自老板的灵魂拷问......
Why?为什么没有?--我 ,我,我也不知道啊.......
有什么办法让我们家的信息出现在AI搜索结果中?
市场部的人开始各种找渠道、找资源中
引发问题
最近爬爬客小编被好几个客户追着问:
自己的企业信息如何在DeepSeek(简称:DS)、豆包、文小言、Kimi、千义通问等
国内大模型搜索结果中被命中出现?
你们能不能帮我做GEO优化上去?
以下都是一些客户的心声截图:
(客户甲--咨询AI大模型的内容截图1)
(客户甲--咨询AI大模型的内容截图2)
(星球社区--留言互动截图)
(客户乙--关注AI搜索推荐结果)
(客户乙--关注AI搜索推荐结果)
(客户丙--关注AI搜索内容索引)
(客户丁--咨询DS的SEO优化方案)
营销思考
看到这里,确实自从这个DS火爆的以后,一些企业老板的商业嗅觉还是很快的。
以前企业老板想:我只要做个搜索引擎的推广或者拍些视频做做自媒体账号的可以实现上线的品牌传播和获客转化目的。
现在这个DS出现,越来越多的人已经开始依赖通过AI搜索去寻找答案内容,而且这个AI大模型行业赛道还是属于国家所鼓励的科技型行业,更是未来的互联网搜索生态的新趋势。
对于普通人来说,AI方便了我们寻找信息和答案,更多的在企业老板眼里:
客户在AI里面搜索找供应商资源,我的企业信息如何能大概率被AI命中,被推荐?
这时候这个AI在企业老板眼里就是活脱脱的免费变现流量密码!
(我去,这不就是钱吗? 表情包)
继续说人话
我们搞懂AI搜索与传统的搜索引擎的区别?
传统的搜索引擎是通过关键词搜索去触发相关的原生网页信息,做排名展示给用户,通过SEO优化的方式去获得搜索引擎的信赖,得到更多的自然流曝光排名。
AI搜索主要有检索(Retrieval)和生成(Generation)两个部分组成。
AI搜索流程图 ,图片来源:ThinkAny创始人idoubi、AI产品黄叔编辑
在检索方面:
AI搜索会接入传统搜索引擎的API接口资源,采用自建索引库的方式,进行数据收集与预处理,包括网页、文档、数据库等资源。
先检:先将收集到的数据需要进行清洗,去除噪声、重复和错误数据,以提高数据质量。对于文本数据,还需要进行分词、词性标注、命名实体识别等处理;对于图像和音频数据,则需要进行特征提取,将其转换为数字特征向量。
后索:索引构建是提高搜索效率的关键步骤。对于文本数据,构建一个词汇表,包含数据集中出现的所有唯一词语或短语。倒排索引是信息检索系统中最常用的索引结构之一,它将每个词语或短语映射到包含该词语或短语的文档列表,记录词语在文档中的位置等信息,从而在检索时能够快速定位包含查询词的文档。
然后进行自然语言处理(NLP)技术使计算机能够理解和处理人类语言的复杂性和多样性。通过词法分析、句法分析和语义理解等技术,将用户输入的自然语言查询转化为计算机可理解的形式。
常见的检索模型有:
基于关键词匹配:最简单的检索方式是将用户输入的查询词与索引中的词语进行直接匹配,返回包含这些关键词的文档。这种方法适用于简单的检索需求,但对于语义理解和上下文处理能力有限。
向量空间模型:将文档和查询都表示为向量空间中的向量,通过计算向量之间的相似度(如余弦相似度)来确定文档与查询的相关性。这种方法能够更好地处理语义上的相似性。
概率模型:基于概率理论,计算文档与查询相关的概率。概率模型考虑了文档和查询的统计特征,如词语在文档中的出现频率、文档的长度等因素,以估计文档与查询的相关性
排序算法:根据检索模型计算出的文档与查询的相关性得分,对检索结果进行排序,将相关性较高的文档排在前面。排序算法可以基于多种因素,如关键词匹配程度、文档的权重等。
智能体协作:在某些高级系统中,多个智能体协作动态调整检索和生成的过程,减少“幻觉”现象(即模型生成不准确或凭空捏造的内容),提高回答的可靠性和上下文相关性。
在内容生成方面:
AI搜索就是根据用户给的提示词需求,再进行深度学习模型,在训练过程中会不断尝试和调整,通过优化算法纠正错误,最终从大量数据中提取符合用户需求的规律。基于检索出来的内容,通过不同的模型生成回答,常见的有文本生成、图像生成、语音生成。
那么问题来了
在AI大模型中我们真的可以做到可以利用AI的SEO优化内容,帮助企业获得更多的AI搜索推荐流量曝光吗?就是最近大家在说的GEO优化的话题。
这个问题我们先倒推下,实际去多做测试看看(不同领域的行业关键词提问),实际看下不同的AI给的答案是否有规律可循?
我们先举个例子:上海知名装修公司推荐名单 去问下AI,出来的结果截图:
以上是DS给的第一次答案
以上是百度结合了DS大模型给的第一次答案
以上是豆包给的第一次答案汇总
以上是Kimi给的第一次答案汇总
DS联网搜索以后的页面索引
腾讯AI元宝内容生成的页面索引
做个对比
我们都把他们汇总在一个表格上,出现【频率较高】都标记下颜色和序号:
DeepSeek | 豆包 | 文小言(接入DS模型) | Kimi |
申远空间1 缘环装饰1 | 上海丽达鼎玺 | 缘环装饰2 | 缘环装饰3 |
聚通装潢1 聚通装饰2 | 尚层装饰1 | 聚通装潢3 | 统帅装饰2 |
百姓装潢1 波涛装饰 | 星杰装饰2 | 绿通装潢 | 百姓装潢3 |
尚海整装 同济装饰 | 美家美沪 | 境远装饰 | 聚龙装饰 |
俞润装饰 统帅装饰1 | 圣都装饰 | 尚层装饰2 | 家悦可可装饰 |
星杰设计1 百姓装潢2 | 波涛装饰 | 荣欣装饰 | 申远空间2 |
大显设计 九间堂装饰 | 上海贞匠装饰 | 星艺装饰 | 佳园装饰 |
沪尚茗居 T6国际设计 | 欧碧雅 | 红蚂蚁 | 尚层装饰3 |
以上的4个大模型,在推荐内容上的信息 基本上涵盖了上海主流的装饰公司。
我们在从本次的样本内容做下简单的信息来源的内容分析:
1、Kimi索引来源资讯行业站(网站、网易、搜狐、知乎)高权重值平台内容信息;
2、文小言的索引来源有2个点:百度首页自然排名靠前的内容(有百家号、网站、资讯平台);
3、豆包的索引也是自家的平台内容:今日头条、抖音平台的信息;
4、Deepseek在的答案前者是深度思索结果和全网联网搜索的结果差异。
单单看表格,看不出有什么差异化,被标红的几个商家是被几个AI大模型同时命中推荐了。
共性规律
我们就这一次的搜索概率去做个规律倒推总结:
ü 这几个装修公司名称在全网的SEO优化内容布局上出现的内容量和关键词频次确实比较多;
ü 被AI索引的网站共性:高权重站(垂直门户、资讯平台、行业大站);
ü 内容发布者特性:高权重活跃网站(收录高)、活跃的自媒体账号、权威的媒体资源;
ü 内容发布的时间:都是比较靠前,小编细看了80%的内容在1年以内,甚至是最近2个月内的软文内容,所以时间窗口的也是AI索引的一个因素之一;
ü 平台之间的信息孤岛导致的AI结果也有差异。
百度主要的内容基于网页和自身的子产品内容(百家号、文库、资讯站);
豆包的内容来源:抖音、头条软文,用户的阅读量和曝光量都有影响AI在对文章内容的索引和认同;
腾讯元宝将微信公众号作为语料库进行索引(原因:微信公众号是屏蔽搜索引擎爬虫抓去的)。
ü 索引的内容形式上:内容明细上更加的数据化、长篇幅、内容差异化、引用的权威化。
这次只是用这一个问题需求词去做了AI测试,后面我们可以用类似方法,设置好你想要问的需求词再去测试看看,譬如通过:时间、地点、职位、前置条件的形式,总结出以上的内容共性规律,还是需要多去实操总结。
写在最后
说到这里,这些被AI所推荐的企业,除了要感谢AI大数据平台,最应该感谢的还得是自己市场部的人,一直这么做年坚持在做内容营销或者全域的SEO优化内容营销,积攒下来的家底(网站权重、链接收录、媒体资源、关键词布局、内容多样化维护、全渠道覆盖)。
然而那些已经半路放弃做内容营销或者SEO优化的商家,又或者之前老板就压根没关注做内容的长期主义者,是不是要哭晕在厕所?
不过也没什么大不了的,平台的AI算法都是在一直改变的,现在开始慢慢积累做也是来的及的,如果真的想把GEO优化做出效果,最终来源还是建立在传统的搜索引擎的SEO优化基础之上。
当未来当大家越来越依赖AI搜索获取信息的时候,这个必将成为企业常态化的营销一环。