救险车厂家
免费服务热线

Free service

hotline

010-00000000
救险车厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

周富秋海量信息将推在线智能计算引擎

发布时间:2021-01-20 10:33:18 阅读: 来源:救险车厂家

8月24日上午消息,2011中国互联网大会今天进入了第二天的议程。在今天下午举办的“中国互联网高层论坛”上,海量信息技术有限公司首席科学家周富秋表示,传统搜索引擎仍是原始的数据罗列,海量信息要打造一个在线智能计算引擎。新浪科技全程报道此次论坛。

以下为演讲全文:

周富秋:大家好,互联网对于我们生活的冲击,我想大家都应该知道。在中国短短的十几年时间,它首先改变的我们的阅读模式,我们的沟通模式、娱乐模式,进而又改变了我们的购物、社交、经营模式。我想以后的改变还会更多,它会成为改变我们整个人生的一个重要的推动力。

现在我们看到网络是无处不在,我们感触到网深入到我们生活、工作的每一个角落,每个人都在感受它,所以我们经常在问如果没有网络我们该怎么办。我想我们正在经受而且即将经受互联网将像水、电一样,俨然是我们生活的日常活动。但是与此同时我们往往说,我们在享受互联网给我们带来的几缕阳光,与此同时我们在领略着互联网的阴霾。

面对这样的情况我们该怎么办?我们都在憧憬互联网的下一代,我们都在憧憬未来十年互联网会是什么样。在大会上我听到更多谈的是移动互联网、云计算、物联网。但是在我的心目当中,我首先关注的是互联网到底给我们社会带来什么样的价值,互联网大量的信息应该怎么去处理,让它把这些信息转为有价值的东西,服务于我们的生活、工作。所以说我认为未来的互联网还有一点关键的,就是一定要结构化的互联网、个性化的互联网、互动性的互联网,这是我今天讲的最主要的一点。

我借用美国一个著名思想家凯文凯利的一句话,他认为互联网并不是会更好,只是会不一样。不一样在哪些方面呢?第一个是更聪明的,就是智能化、结构化。第二个是更加人性化、个性化,因为现在的市场细分了,不同的市场、人群需要不同的信息需求。第三个是无处不在,无所不包,就是指向将来的云计算。我们还要关注一点,就是互联网的内容,怎么把它有条理的系统的加以结构化、个性化,这是我所关心。

整个IT行业从60年代开始经历了这样一个阶段。第一个是计算机互联,然后随着互联网的兴起,我们把信息也归纳起来了,我们把信息做到页面内互联,但是真要让互联网数据更好的给人们带来价值,更重要的是要深入内容里面去抓住一些语义关联的东西,最终我们要树立关联。也就是说我们希望将来所谓的网络是有语义关联的,它里面的东西所提到的人、事、物是有语义关联的,是智能化的。就是说将来我们的网页看到的东西不是在网上的数据是平淡的、扁平的、孤立的,我们要看到一个语义数据网络,就是把静态的网页变成动态的,有语义关联的网页。也就是说将来我们希望网络数据是呈现相互关联的状态,我们只看到冰山一角,我们希望看到整个的状态。也就是说经过结构化处理以后,我们一个页面上提到的概念,和另一个页面上提到的相同概念之间是关联的,而且每一个网上提到的人是独一无二的身份,而且每一个事情都拥有特性。如果中文网页上出现了两个字北京,我希望互联网知道它是一个地名,是中国的首都,有经度、纬度、人口等等。也就是说我们希望将来的互联网要智能化、结构化,所以说海量信息技术有限公司我们在打造一个在线智能计算引擎,这个引擎本身是希望把大量的数据经过加工、条理化处理以后把数量变成质量,我们不希望人们再重复的经常的有一个病症,高度信息污染综合症。我们随着互联网的成长我们在染上一种病,就是信息污染综合症,我们需要把数量变成质量。也就是说把单纯的信息服务转换成能够提供知识。将来把互联网作为个纽带,能够把每一个网站和整个互联网搭建成一个语义逻辑整体,最终实现的是让计算机连通互联网。

我们海量信息在打造一个WOS平台,我们是上升到应用层面,最后到服务层,最后让客户通过一种手段把他连接到我们的服务器上,我们给他提供知识和情报。通过这个平台把网上大量非结构化或者是半结构化的信息,把它转换成一个结构化的数据,这个结构化数据是可以重复使用的,是可计算的,你拿来之后可以进行知识的重组和构建。也就是说我们下一代互联网一定要对内容进行重组。第二个是所谓智能化处理,把网页上提到的人与物之间的关系,人与人之间的关系,以及人的行为经过结构化的处理以后,我可以做到语义理解,我可以做到智能推虽,可以做到连接无忧。这就是我们海量所想象的下一代互联网的结构,是智能化、结构化。

我举一个简单的例子,我们已经推出了一系列的产品,有三大产品系列。第一大产品系列叫做智能采编服务,是供互联网编辑使用的。地个是智能净化服务,为了搭建一个和谐健康的互联网环境,我们用机器去识别、辨别违法的、低俗的信息,做到自动过滤。第三个我们还有一个智能的发布体系,这些可能在座的有些客户已经用上了,可能有一些体验。

再举个例子我们怎么对网页进行结构化处理,比如说我们要读懂中文,首先很重要的一点就是我们一定要对中文的结构进行解析,把它解剖看里面含有什么东西。比如说我打开一个网页看到宁静两个字,比如说宁静的夜晚、宁静的夏天,大部分作为形容词。我们通过智能分析以后发现,在涉及到娱乐圈的时候,宁静这个词不一样了,它代表一个明星的名字,我知道了以后就能够判别出来这篇文章里面宁静是一个演员、明星。然后我通过识别系统判断它是一个人名、属性,然后把这个属性打开以后发现它跟其他的东西有关系,跟电视电影电视剧有关系,这样语义网络就出来了。随着语义网络的出现,我们也可以看到另外一种模式,就是和其他的明星也有关系等等。这个时候我们推崇的一再强调的对语义进行条理化、系统化处理以后,让语义之间有关联,这就把互联网的内部盘活了。

比如说我们有一个客户,他经常说我要为一个广告公司推送到底哪些明星能够做我的广告代言人。

我们为中国移动业提供了服务,就是移动化的过程中怎么提供个性化的咨询服务,就是我能不能用智能计算的手段推荐他所需要的东西。比如说我们对所有人进行建档案,通过他的行为结构,因为人是互联网当中最活跃的,人本计算是互联网将来发展一个重要的关键点。对他的行为结构化进行分析,然后从特征中进行提取,然后看他的行为轨迹,根据他个人的行为可以对他所感兴趣的资讯进行组装、推荐。在推荐的过程当中,我们还更进一步了解他的行为。这是用户A、用户B的关心、轨迹、模式往往是不一样的,所以推荐的也很不一样。

下面这个对行业网站来讲,比如说医疗体系,医疗体系我们也有智能手段,能不能协助他推送网上的医疗服务,这一块也很重要。我们与他们交流中发现,大量的网民在网上提问题,说我患了一种病,我有这种症状,他有很多描述,提出很多乞求。往往一些大夫就需要专业人员进行分诊,看他到底属于什么样的病种,都是耗费大量的人工、成本去处理的。我们进入以后对这些数据进行处理,然后推荐出关键的技术点,能不能推送出他对于这个咨询网页的专业词语提取,以及对它进行规划、统一化建立一套技术点,然后这些技术点可以正确的识别出他属于什么样的病类,而且也能够推荐他需要看的大夫。目前我们正在试用过程当中,目前我们的精确度准确率达到了90%,我们可以通过智能化、结构化以后把大量互联网的信息进行萃取,提炼出客户到底需要什么东西,然后进行满足。

将来说移动互联网、云计算这都对,但是真正要解决的是给网民带来社会价值,如果我们还是纯技术上的东西也可以,但是如果不能解决工作、生活当中的实际问题,他仍然感受不到互联网的真正魅力。将来我们拿到手机以后指向什么地方,我很多结构化的信息经过我们处理以后,能够叠加到影像中把它显示出来。未来的信息都是经过结构化处理,如果说我们实现了云计算,但是没有数据支撑还是很难达到用户所需要的模式。

根据我们看到和经历的整个计算平台的转移过程当中,逐步是向云计算向智能终端、移动终端转移,把网络内容结构化完全可以支撑下一代智能计算平台。

微博主持人:杜老师你好,现在移动网站和互联网站这么好,SNS上面有人可以问,手机可以定位,这是不是会对传统搜索引擎造成冲击?

周富秋:传统搜索引擎还是原始的数据罗列,只要对数据结构化智能处理,再对搜索引擎的搜索值加以分析,将来的潜力无穷。

塔防三国志3d破解版

武林至尊

全民SF官方版

相关阅读