搜狐网站
搜狐 ChinaRen 17173 焦点房地产 搜狗
搜狐IT-搜狐网站
IT频道 > 通信 > 国内电信 > 谁来斩断制造垃圾短信的黑手? > 垃圾短信治理最新

关键词过滤方案受质疑 短信治理面临技术门槛

  近日,新成立的工业和信息化部宣布,已联合国务院新闻办、公安部起草了《通信短信息服务管理规定》,该规定将对短信息服务和管理问题进行系统规范,并明确禁止发送违法内容和违规发送垃圾短信行为。

  从电信设备和电信业务入手治理短信,是其第一步举措;第二步,必将是与内容有关的信息“过滤”。

有关专家评说。

  目前的市场环境下,单靠政策很难完全清除垃圾短信,还需要强制过滤手段。这其实与垃圾短信的定义有关。通过手机用户端的定义控制垃圾短信,只有在用户反复收到,已经明确其为垃圾短信的情况下才能设置。更多的垃圾短信让你防不胜防,难辨真伪。比如,今年2月在京城大面积传播的汽油价格上涨,使北京所有加油站“车满为患”,造成了交通的极大拥堵,以致第二天,北京各大媒体纷纷辟谣,给社会造成了极大的负面影响的“谣言”短信。

  对待上述情况,专家认为,必须借助内容的“过滤”技术才能有效遏制其传播。具体来讲,一方面,“过滤”技术往往建有强大的已知“知识库”,可以依靠以往经验准确定义“垃圾短信”的特征。只要符合定义特征,立刻“拦截”;另一方面,过滤的同时,本身还包含“舆情”捕捉功能,当某个信息反复出现,程短时爆发状态上升时,“过滤”技术便能准确识别出来,将其排在首位,然后再通过人工迅速判断信息真伪。一旦发现有误,立刻阻止其进一步传播和蔓延。这样“已知”和“未知”垃圾都可得到有效遏制。

  目前,市场上流行的过滤技术有两种,一种是“关键词”过滤,即通过定义个别的词达到“过滤”效果,一种是“语义”过滤技术。两者技术区别在于,后者除了关键词之外,还添加了语境的分析,也就是褒贬义分析和立场判断,分析一句话到底是批评还是赞扬,肯定还是否定,从而达到准确过滤的目的,避免“错杀无辜“的现象出现。

  我国语义分析专家——中科院声学所研究院黄曾阳指出,“关键词技术基于西方拉丁语系而来,西语是表音的文字,而汉语是音形义结合的文字。中文本身非常复杂,不同于西语“非此即彼”的表达方式,表述形式更为多样。用电脑模拟人脑语言感知过程,从逻辑思维角度对语义进行判断,从领域、情景、背景三方面分析得到结果,即 HNC (Hierarchical Network of Concepts 概念层次网络)理论,使中文语言处理实现了实质性的突破,消除了语言多重模糊,搜索过滤更为精准。”

  北京大正语言研究院是该理论研究与应用的承担单位。据大正研究院院长陈小盟介绍“目前,该理论已经非常成熟,先后被列为国家重点科技支撑中文信息处理应用研究与系统开发项目、国家973计划项目、国家863计划项目及中科院知识创新工程等项目。实际应用的应用转换也在进行,针对垃圾短信,研究院早已研发出手机短信过滤方案,眼下正在针对电信应用做专门优化。他表示研究院愿意积极与运营商方面展开进一步的合作。”

(责任编辑:romp)

我要发布

用户:  匿名  隐藏地址  设为辩论话题

*搜狗拼音输入法,中文处理专家>>

新闻 网页 博客 音乐 图片 说吧  
央视质疑29岁市长 邓玉娇失踪 朝鲜军事演习 日本兵赎罪
石首网站被黑 篡改温总讲话 夏日减肥秘方 日本瘦脸法
宋美龄牛奶洗澡 中共卧底结局 慈禧不快乐 侵略中国报告



说 吧更多>>

说 吧 排 行

茶 余 饭 后更多>>