为何世界上只有四个国家拥有搜索引擎核心技术?

2023-08-05

  搜索引擎的核心技术是什么?别看百度、谷歌的网页就一个输入框,他们涉及的技术非常多。而核心技术也非常多。但对于搜索引擎来说,最大的核心技术就是搜索引擎的算法。这个算法重点要解决的就是“如何将用户想要的并且优质的内容推荐给搜索用户”。这个算法的优劣决定了搜索引擎公司在这个市场上的地位和影响

  百度公司成立于2000年,但在这之前,李彦宏这位北大毕业的天之骄子已经在美国留学。他在布法罗纽约州立大学完成了计算机科学硕士学位,毕业后来到了日本松下实习三个月。然后在1994年去了华尔街,在这接下来的三年里,担任过道琼斯公司高级顾问、《华尔街日报》网络版实时金融信息设计者。

  1997年是李彦宏重要的一年,他离开了华尔街去了硅谷当时著名搜索引擎公司infoseek(搜信)公司。在这里,李彦宏亲身经历了互联网的发展,也初步看到了搜索引擎的魅力。他在这里把学校所学应用到搜索引擎中,尤其是信息检索技术。

  1998年第七届会召开,李彦宏在会上作了“How to find spam in web search”的主题演讲,这时的李彦宏已经决定在互联网领域做搜索引擎。并在美国拥有了关于超文本的专利United States Patent 5920859。这应该算是百度早年的核心技术吧。这个专利技术的核心内容就是:先给链接数据库里的链接估算“重要度级别”;然后利用链接本身的重要程度,估计它所指向文章的质量。这个关键的推荐算法就是解决我前面提到搜索引擎的核心技术。

  至于有网友说谷歌创始人拉里·佩奇和谢尔盖·布林也是听了李彦宏的演讲才创建了谷歌,这个有点无脑宣传。事实上,谷歌创始人早在1996年就在学校做了搜索引擎,那个时候叫做“BackRub”,非常好用,但因为消耗带宽太大(那个时候带宽都很小)被学校服务器撤下来了,于是两人就在车库里用二手服务器继续。1997年将搜索引擎名字改为Google,1998年受到Sun公司创始人的投资启发,正式注册了谷歌公司。在第七届www大会上,谷歌创始人同样发表了主题演讲“The Anatomy of a Large-Scale Hypertextual Web Search Engine”。他们将谷歌搜索引擎整体架构都全部讲出来了。而谷歌两位创始人上千询问李彦宏,也只是问李彦宏“你怎么将它商业化”。由这个可以看出,谷歌当时已经有运行2年多的经验,演讲已经将所有架构都讲出来了,而李彦宏还是在infoseek上班,只讲了理论技术和梦想。所以,反而应该说,李彦宏在这次大会上受到了谷歌创始人演讲的启发。

  1999年李彦宏回到国内,并且在2000年以前面提到的那份专利为基础,融到了第一笔资金,创建了百度公司。只有百度在那份专利的基础上,不断优化以提高百度搜索的体验。所以,百度的搜索引擎推荐算法就是百度的核心技术。世界上为何只有四个国家拥有搜索引擎核心技术世界上应该有五个国家有搜索引擎的核心技术。包括美国、中国、韩国、俄罗斯、法国等。那其他国家为什么没有呢?主要有以下几个原因:第一,谷歌算是最早搞搜索引擎的公司,核心技术也确实是最先进的。有先发优势,占领了全世界很多国家的搜索市场。当人们习惯了谷歌,很难去适应用一个差很多的新搜索引擎。而新开发的搜索核心技术肯定比不上谷歌,基本就只能关门了。

  第二,看现在风靡全球的大数据技术就知道,大数据技术最早的原型就是谷歌用来为搜索引擎服务的工具,包括数据收集、分析。MapReduce,GFS就是谷歌很早以前就开发出来的技术。如今,互联网信息是爆炸式增长,搜索引擎技术核心技术已经不能仅靠推荐算法了,除了推荐算法还需要大数据技术,和人工智能AI技术。这些技术结合在一起才能算是当下搜索引擎的核心技术。新兴公司很难追赶。

  第三,李彦宏的百度已经在利用人工智能技术,尽可能高的提高计算机对人类自然语言的精准识别能力,同时,通过计算机图形智能识别技术,来实现以图搜图和图像结构化的功能。不可否认百度在搜索上一直在前行。

  综上所述,过去搜索引擎的核心技术就是内容推荐算法,百度李彦宏是一个高材生,一直致力于研究内容检索和互联网才使得百度有了自己的核心技术。而至于世界上为什么只有五个国家有核心技术,是因为先进的谷歌已经霸占了市场,快速发展的大数据、人工智能技术已经融合到搜索引擎。这让新生公司在没支持、没市场的情况下,是很难发展起来的。以上是我的粗浅见识,希望可以帮到你,如有不到之处,还请多多指正。

Axial Fans