欢迎光临
我们一直在努力

百度和Google的编程接口比较

百度和谷歌是着名的搜索引擎,他们拥有非常丰富的搜索资源信息。许多人想编写程序来调用搜索引擎的有价值数据。我昨天写的程序是打电话给百度的搜索界面。为何使用百度?实际上有一个原因。我原本打算打电话给谷歌的界面。 Google本身还提供Google SOAP Search API供程序员调用。它每天可以拨打一千个搜索电话。由于API是通过Web服务提供的,因此最好的调用是通过Java。但是,不知何故,当我调试时,搜索英语没有问题,搜索中文是一个老式的数组溢出错误。由于我的调用程序需要访问Access数据库,我仍然打算用VB编写,通过VB直接访问Google的搜索页面,所以我很快写了一个程序,通过VB直接调用Google查询。这是一个失败,让我感到惊讶,因为我在去年6月写了类似的通话程序,当时少数直接拨打谷歌搜索的电话成功了。呼叫现在失败,表示此功能已完全禁用。出现的错误屏幕如下。该信息是指一个地址,即“Google个人服务条款”,其中包含以下内容之一:“请勿执行自动查询:未经Google事先明确许可,不得向Google的系统发送任何形式的自动查询。请注意,“自动查询”涉及向Google发送查询,以便在使用软件搜索不同内容时确定网站的Google排名。“这也禁止用户编写直接调用Google的程序,但必须通过类似于Google SOAP Search API的界面调用。每天的查询数量限制为少于1000次。
然而,当我通过相同的原则打电话给百度搜索引擎时,我发现这个电话是完全正常的。百度可以返回正确的搜索结果,但有时搜索结果会有出价广告。我试图提高通话频率,并在短时间内搜索了5000多次。我发现该程序仍然正常工作,百度仍将返回查询结果。由搜索引擎开放程序直接调用,对许多程序员来说都很方便,所以即使百度没有提供类似Google的API,我们也可以通过编程方式访问其搜索资源。当然,我也猜测百度并不一定为了大众的利益而这样做,因为百度此前已经推出了一些搜索插件,类似紫色的拼音输入法也会绑定百度的插件,所以会有大量通过客户端程序不是浏览器访问百度,而百度很难在这方面判断和识别,所以它直接打开应用程序直接调用搜索。谷歌没有推出类似的客户端插件,因此为了节省服务器资源,它只是关闭客户端的直接调用。客户的这种打电话对百度来说也是一定的压力。如果您滥用这些资源,那么百度也可以通过致电Google来学习直接关闭客户端。因此,您不能滥用资源。例如,我昨天提供的程序限制了。您一次最多只能执行500个查询,以避免搜索服务器过载。

未经允许不得转载:美国主机评论博客 » 百度和Google的编程接口比较

分享到:更多 ()