高效搜索信息你需要掌握的搜索技巧

2023-08-09

  现在是互联网的时代,学习的方式已经同过去完全不同。二十年前你想去学习一门新技能,只能通过问人、图书馆查资料、买书、上学习班等现在被称之为“线下”的方式。

  互联网的崛起把全球的信息都结成了一个网。在这个共享时代,你经历的事情很多人也经历过,你碰到的问题很多人也碰到过。他们中有很多人最终没有解决问题,但不乏也有人解决了,同时他们会把经验和方法分享到网上。

  由于互联网一个取之不尽用之不竭的大宝库。流量大了,必定成了商家吸取流量的地方,这些商家走过的地方都留下个各种虚假且重复的信息。导致 99% 的人都只是在「用」搜索引擎而没有「用好」它。今天最应该做的事情就是学习互联网时代人人必须具备的一项技能——搜索。

  花 5 分钟阅读一下这篇文章,就能在「使用搜索引擎」这件事情上战胜 99% 的人了!

  搜索引擎是指根据一定的策略、运用特定的电脑程式搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。网际网路上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为用户绘制一幅一目了然的信息地图,供用户随时查阅。

  搜索引擎的抓取程序(SEO蜘蛛)起初会以一个网(互联网)中的一个点(某个页面)开始发散式的进行收录。他们的任务很明确,无时无刻都在顺着链接不断抓取互联网上还没有被收录的网页的和链接,然后将抓取的网页信息和链接信息存储到自己的临时数据库中。

  由于互联网上充斥着大量的垃圾页面和无效页面,而这些页面内容不管对于搜索引擎,还是搜索用户来说,都是解决不了用户需求的。因此,搜索引擎为了避免这些垃圾无效页面占用自己宝贵有限的空间资源,会对蜘蛛抓取回来的内容进行审核过滤。

  将通过了过滤模块“审核”的网页会进行分类和数据格式标准化,然后将其存储到各家搜索引擎的索引数据库中,实现这个功能的程序模块,我们称之为收录模块。如果你的网页链接通过了收录模块,那么就有机会可以获得排名。

  对存入到索引数据库中的页面,通过各家搜索引擎一系列的算法,会得到每个页面的权重,然后将其进行排序处理,便于搜索时进行检索。每一家搜索引擎都会有自己的独门绝技(算法),谷歌当初就是考自家的「PageRank」算法起家。

  在大型局域网(互联网)的今天,你以为搜索是一门技术,其实搜索是一门忍术。你必须忍受不同平台各自为阵,内容信息就像孤岛,也必须忍受搜索结果被活埋在广告堆中……以至于,目前来说,好的搜索方式,不止是掌握了搜索方法,还要找对平台(对应的门户网站)。

  备选搜索引擎但是中文互联网的信息散落在各处,各自筑起了高墙,互相屏蔽,所以在 Google 找不到答案,试试以下平台:

  微信搜索:不可否认,微信已经聚集不少优质内容,可惜「封印」的搜索引擎的爬虫。

  Magi:基于机器学习的信息抽取和检索系统,提供可解析、可检索、可溯源的知识体系。

  Wolfram Alpha:直接向用户返回答案,而不是像传统搜寻引擎一样提供一系列可能含有用户所需答案的相关网页。

  搜信源:帮助用户以最短的时间直达权威信源,更高效地判断和使用公开信息。

  信息偏差因为死人不会说话(不能从由死者/淘汰者/离场者获得信息),当信息仅来自幸存者(成功者)时,得出的结论就会与实际情况大相径庭。兼听则明,偏信则暗,不要「只看贼吃肉,不看贼挨揍。」

  不含情绪新闻只提供事实,没有情绪,所以,远离标题党和充满感叹号的文章,珍惜有限的生命时间。

  怀疑信息在疫情之中,受过高等教育的人也会对传播的假消息的阴谋论深信不疑。科学家对此也做了一系列研究。我们每天都被各种信息轰炸,因此我们经常依靠直觉来判断信息是否真实。正如英国广播公司未来频道过去所描述的那样,虚假新闻的传播者往往通过一些简单的技巧让信息感觉“真实”,阻碍了我们运用批判性思维核实消息来源的真实性。澳大利亚国立大学的纽曼(Eryn Newman)证明,在一篇文章旁配上一幅图片,会增加人们对其准确性的信任,即使这幅图片与文章内容无关。比如,一张病毒的普通图片与一种新治疗方法的文字同时出现,图片并不能证明文章本身,但是它帮助人们可视化一般情况。我们将这种“处理流畅性”视为说法正确的标志。出于类似的原因,虚假信息还常采用描述性的语言或生动的个人故事,提供足够多的熟悉事件或数字,比如提到一个公认的医疗机构的名字,从而使它与我们之前的知识联系在一起,让人感觉信息是令人信服的。即使是简单地重复一句话,无论是同一段文字,还是多条信息,都可以通过增加熟悉感来增加“真实性”,而人们会把这种熟悉感,误认为是事件的真实性。因此,我们在新闻推送中看到的东西越多,就越有可能认为这是真实的,即使最初持怀疑态度。

Axial Fans