思即美德

Thinking as a Virtue

最近的一点儿体会:
  1. 还是写自己 just fit 的程序比较明智,那些笨重的库只会把事情搞得一团糟,更糟的是你最后仍然不得不去读懂它,来判断问题出在哪里,无论从时间还是体积的角度,都得不偿失。
  2. 在自然的状况中,语言是一个流,如果我们把它拆成零散的句子,甚至词,就不得不在所有歧义中排岐,而这件事是人类理解语言时不需要做的。人类理解语言的方式是基于预测的,当人类听到一句话,会对下一句话有预测和期待,应用到机器上,就是对下一句话的可能性进行预测,得出较少的可能性期待,然后将实际输入的下一句话与这些期待进行比对,如果全都不符,再进行更复杂的判断,而不是先得到一句话,再从它能表达的所有歧义进行排岐。
  3. 我一直认为,如果想让机器和人一样好地理解语言,就必须让机器模拟人的认知过程——我的意思是,语法和词性只能成为我们考托福的捷径,而真正理解语言时,并不是它们在工作。
  4. 少既是多。

曾淼 说... 隐藏文章

1.“排歧”这件事是现在必不可少的步骤么?哪个环节?

2.不要把对你第4点排歧的工作扔给我们。
   发表于 2/26/2007 10:11

徐杨 说... 隐藏文章

排岐肯定是需要做的,在自然语言处理的部份,比如,我们需要知道在一个同时涉及两个手机型号的复杂句子中,“明亮”一词究竟是说其中的哪一个型号,究竟是说声音还是说屏幕亮度。

第四点没什么歧义,就是“少既是多”,做减法,保持简单,无论从各方面,重新提到它部分源于第一点的想法。

xu.yang@xuthink.com

   发表于 2/27/2007 04:48