xuthink.com
/
xuyang
思即美德 by 徐杨
隐藏所有文章
显示所有文章
打印本页
联络信息
版权声明
我的账户
我的账户
撰写
编辑/管理
关注
网站封面
帮助/反馈
文章列表
较新
少既是多 + 向人类学习
得失心
和谐之年
最小立异,最大平庸
老师们都别怕,你们并不傻
Designers vs. Engineers?
民主,该换种方式选举了
所有买了 ThinkPad 的朋友,可以看看
Lenovo 和 IBM 召回笔记本电池
国美的购物体验
较早
Blog 存档
十一月 2007
九月 2007
八月 2007
六月 2007
五月 2007
四月 2007
三月 2007
二月 2007
一月 2007
十一月 2006
九月 2006
八月 2006
五月 2006
三月 2006
二月 2006
一月 2006
十二月 2005
十月 2005
九月 2005
八月 2005
七月 2005
六月 2005
五月 2005
四月 2005
三月 2005
二月 2005
一月 2005
十二月 2004
十月 2004
三月 2004
十月 2003
一月 2003
聚合
Atom 源
RSS 2.0 源
Thinking as a Virtue
星期五, 二月 23, 2007
向人类学习
隐藏文章
最近的一点儿体会:
还是写自己 just fit 的程序比较明智,那些笨重的库只会把事情搞得一团糟,更糟的是你最后仍然不得不去读懂它,来判断问题出在哪里,无论从时间还是体积的角度,都得不偿失。
在自然的状况中,语言是一个流,如果我们把它拆成零散的句子,甚至词,就不得不在所有歧义中排岐,而这件事是人类理解语言时不需要做的。人类理解语言的方式是基于预测的,当人类听到一句话,会对下一句话有预测和期待,应用到机器上,就是对下一句话的可能性进行预测,得出较少的可能性期待,然后将实际输入的下一句话与这些期待进行比对,如果全都不符,再进行更复杂的判断,而不是先得到一句话,再从它能表达的所有歧义进行排岐。
我一直认为,如果想让机器和人一样好地理解语言,就必须让机器模拟人的认知过程——我的意思是,语法和词性只能成为我们考托福的捷径,而真正理解语言时,并不是它们在工作。
少既是多。
发表一个评论
top
隐藏文章
发表于 2/23/2007 19:04
2 个评论
曾淼
说...
隐藏文章
1.“排歧”这件事是现在必不可少的步骤么?哪个环节?
2.不要把对你第4点排歧的工作扔给我们。
发表一个评论
top
隐藏文章
发表于 2/26/2007 10:11
徐杨
说...
隐藏文章
排岐肯定是需要做的,在自然语言处理的部份,比如,我们需要知道在一个同时涉及两个手机型号的复杂句子中,“明亮”一词究竟是说其中的哪一个型号,究竟是说声音还是说屏幕亮度。
第四点没什么歧义,就是“少既是多”,做减法,保持简单,无论从各方面,重新提到它部分源于第一点的想法。
xu.yang@xuthink.com
发表一个评论
top
隐藏文章
发表于 2/27/2007 04:48
浏览更多文章:
文章列表
Blog 存档