9 八 2010, 11:12下午
semantic:
by

3 点高见,马上去办~~

信息的挖掘

海量信息今天来传教~
他们传教的教义:一个媒体怎么才能更有价值—从掌握信息的发布权到信息的解释权

研究了下他们的教义~

如何掌控信息的解释权,三要素

1,抢抓时效
2,给出解释
3,价值评说

 

   要支撑上要几点就要通过信息处理来挖掘信息和信息之间的联系。

例如下面的一个走势就可以发现两者之间有微妙的联系

image

现在的现状是互联网实现了计算机的互联,刚刚进入了页面的互联,但是信息内部的互联怎么发现并联系起来呢? 计算机读懂人的语言现在还是很困难的咯。

搜索了些资料,大概了解下分词的方法。

现在主要的一些途径是通过语义库,或者连词,标点符号来这些来分析统计大概的意思。

  如,这些通过语义库来,词来替换来让计算机知道大概的意思。

image

或者这样通过一些连词来分析句子的逻辑和语义。

image

image

海量的分词,测试了一下,语义的划分还比较准确。基本单个的分词单元都有比较完整的语义

image

在这里http://www.hylanda.com/pro.php?smid=51 可以测试下。

有了分词,得到以下几个分类的信息。

image

然后按地理或者时间,生成信息展示。

    1. 跟踪每天最新人物发表的言论。

http://labs.hylanda.com/2008090100/Oration.htm

    2. 检索指定的某个人发表过的言论。

http://labs.hylanda.com/ori.php?word=%C0%EE%D3%EE%B4%BA&type=0

    3. 检索言论的内容,如:搜索“李宇春”就可以获得所有对李宇春进行评论的语言和评论人。

http://labs.hylanda.com/ori.php?word=%C0%EE%D3%EE%B4%BA&type=1

 

还可以加上一些信息设计,让信息更直观。

image

image 

七七八八的堆了一东西,大概了解了下中文信息处理。其实,在这信息经过处理之后,得到了很有语义的信息以后,就是我们的工作范畴了~

怎么把语义化的信息可视化的展现出来呢~

 

 

 
  • 我在说

  • 我在看

  • 新文章

  • 文章归档