妞妞拜山记

今天妞又创造了两个里程碑

  1. 第一次穿鞋走路
  2. 和许多小朋友一起玩,表现良好

【细节】“妞妞爸爸”(我这个名字是妞妞的好朋友轩轩起的)和妞妞妈妈都认为妞该去幼儿园了。根据我们的观察,妞的战斗指数惊人,别看才一岁出头,寻常两岁的孩子都不是她的对手。在还只会爬的时候就曾创造把小哥哥A的裤子扒下来的战绩。至于把小哥哥B吓哭,追得小哥哥C直找妈妈,都太寻常,不值得提了。送幼儿园,除了担心打不过病毒和细菌,到不担心妞被欺负(就怕她小宇宙爆发,给我们惹麻烦)。也许能学一些新的武功,也未可知。

read more

美国国家科学基金的评审(3)

[填坑,填完睡觉]

什么样的报告会最可能被据掉?一般来说,NSF的专家小组(Panel)还是比较公允的,虽然偶尔也会有比较狗血的结论。比如有一次,几个牛人中的战斗机一起攒了一个申请,结果最后被据掉了,原因?“你们这么多牛人在一起,怎么内部摆平啊?”牛也有牛的烦恼啊。

假如各位有幸没有这种烦恼,那首先注意下列各点

  • 错别字,错别字,错别字。
  • 糟糕的参考文献。引用太多网页,有权威出处而不引,遗漏主要相关工作,引用格式不规范,等等。
  • 几乎没有既有工作。
  • 和既有工作重叠太多。
  • 没有合理的实验和验证方案。
  • 没有和教育结合的计划。比如研究生培养,博士后培训,高中生科普,等等毁人的方案。
  • 太多的工作或太少的工作

总的来说,评价要素分两大块

  1. Intellectual Merits(技术创新性):工作的重要性,方案的合理性,计划的可行性,组织的严密性等
  2. Broader Impacts(潜在影响):对社会和经济的潜在影响,合理的技术转移方式(比如开源,文章),学研结合,促进公平(affirmative action的意思)。【这一块其实比较软,但是如果专家组找不到好的理由来据,有很大的空间在这里鸡蛋里挑骨头,所以一样要慎之又慎】

这么说太抽象,举几个典型的panel summary(专家组评审意见摘要)的例子:

read more

减排了,全球就不变暖了?

标题党。其实这个帖子讲的是语义信息(semantic information)和信念修正(belief revision)。详见我在Tetherless World Blog上的文章

http://tw.rpi.edu/weblog/2011/03/30/can-cutting-co2-emission-avoid-global-warming/

要义:知道了p → q,那我们对¬P^¬q的信念也增强了,因为p → q包含了对¬P^¬q正的互信息。

P = 减排

Q= 全球变暖

==============

OK, you have been fooled by the title. This post will not talk about environment policies, as I have no courage or knowledge to fight either school about global warming.

read more

不能一部分人比另一部分人更平等

原文发表于西西河,2008-11-14

【声明】为避免误解,再次声明,这篇文章没有任何对反同性婚姻的意见。与之相反,我认为,当代主流的婚姻家庭形式,也即一男一女、一夫一妻的制度,是一种肇源于基督教伦理的、以工业化早期大家庭的解体为背景的、和工业化早期和中期的生产力水平相适应的一种社会制度(institution)。在现在的后工业社会,已经在实践中被逐渐抛弃,在经济上日益破产,是一种行将就木的的制度。不相信这一点的,去看看欧洲和美国的社会家庭结构的统计数据就知道了。同性婚姻的支持者的活动,只是为把这个制度踹到过去时,又加上一脚罢了。我15年前就这样认为,现在还是这样认为,而过去15年的统计[1,2]有力地支持了我的看法。

read more

智学八卦: 记“郝”先生

我在艾奥瓦州立大学的导师,这里称为“郝”老师。我有幸得到他6年的指点。这两天我们几个他的学生一起推荐他拿一个奖,要写写他的一些事迹,所以在这里顺带讲几件他的事。

我第一次见到郝先生,是2001年8月14日。记得这么清楚,因为印象十分深刻。我约了他在系里见面。待我怯生生地敲了门,门背后细细簌簌一阵声音,一个有点谢顶的脑袋从半开的门里探出来,带着些许歉意的笑容,道:“走,去对面谈”。

read more

我长大了,要当科学家

某日和以前在艾奥瓦的同学闲聊,他说:“我儿子以后要敢读博士,我就和他断绝父子关系”。

于我心有戚戚焉!

我现在特不明白,为什么小时候写作文,要写“我长大了,要当科学家”。唔,为什么长大了要当白大褂老头呢(动画片里都这么画老科学家的)?

现在,20+年以后,似乎快接近这么目标了。直到有一天,我们家阿姨看着我熬夜熬红的眼睛,鸡窝似的头发,走样的身材,同情地说:

read more

东市、西市和股市

若论唐宋城市的的差别,莫如从坊市到街市的发展。原来在唐代城市,市场在专门的街区中,并不是对着大街开门的,里面有各种各样的店铺……有同学说了,不就是Shopping Mall吗。唔,差不多。比如长安,有东市、西市(见左图,来自Wikipedia),每天中午开市,到了天黑就关了。到了宋代,商铺开到了大街上,就象同学们在《清明上河图》里看到的,非常适合压马路。有历史学家说这是进步。至于为什么压马路比逛Mall进步,有待进一步学习。

read more

走路,打鼓,和喂爸爸

妞妞最近可开心了,因为她刚学会走路,摇摇摆摆象个企鹅,从一个屋摆到另一个屋,手舞足蹈,伴以不时来个屁股墩儿。我第一次知道原来走路也这么可乐。嗯,也第一次知道看别人走路也这么可乐。

妞妞最近困了,就会拍自己肚皮,因为我们经常在睡觉前拍着她的小肚皮哄她。没事的时候,她会拍米老鼠的肚皮,哄它睡觉。她也发现我的肚皮非常适合打鼓,只要我一躺下,就抡起她的小胖爪子,梆梆梆,梆梆梆,哦哦大叫,拍得乐不可支。有时候拍累了,还想听响,就抓起我的巴掌,象征性地指挥我自己拍。

read more

关于印度的交通和土地所有制

原文发在西西河,2008-07-18,http://www.ccthere.com/topic/1704585

———————————–

我不看好印度, 因为一个现代化的国家必然是内部市场发达, 各地联系紧密的国家. 这样的一个国家必然是交通基础设施非常发达的国家,它的铁路和公路系统必然是深入全国各地而且现代化的.

我敢说,印度在可以预见的将来, 比方说20年内, 建不成可以和中国比拟的现代化交通体系. 具体来说几个指标, 就是500万公里以上的公路, 5万公里以上的高速公路 (美国是9万公里), 10万公里以上的铁路(其中主要干线是电气化的), 1万公里以上的高速铁路. 这些指标, 中国或者已经达到, 或者按现在的趋势在可以预见的将来达到. 而印度在其中任何一项都看不出达标的可能: 要知道, 印度今天6万多公里铁路的85%是独立前修造的.

read more

法国军事胜利

试着在Google上搜一下“French military victory

第一项是:

还有一个恶搞

A complete list of French Military Victories (法国军事胜利完整列表):
End (完).

所以有人说,法国这次在利比亚猴急,是要寻找拿破仑时代之后的法国第一场胜利。

如果萨克奇真心想事成,恭喜,法国已经和乍得一样,实现完胜利比亚的业绩。

如果只算单挑(所以第二次鸦片战争,八国联军,海湾战争等等都要排除),根据Wikipedia,拿破仑之后还是有不少法国的胜利的,主要是殖民战争(比如中法战争)。

read more

《让子弹飞》之春秋笔法

让子弹飞海报鲁迅先生说《红楼梦》:“单是命意,就因读者的眼光而有种种:经学家看见《易》,道学家看见淫,才子看见缠绵,革命家看见排满,流言家看见宫闱秘事”。

同样的话可以用来评价《让子弹飞》:文化官员看到主旋律,精英看到民智未开,带路党看到革命,五毛看到革精英和带路党的命,打酱油的看到恶搞,宅男看到抢女人。

我看到…….像素,很多很多的像素。只觉得它好。在讲什么,好在哪里,什么含义,不知道。因为语义解码失败,所以我只算是和许多像素交流了一个多小时。

read more

茅于轼今天又行为艺术了

见《不要拿我交的税款去建航空母舰

做人要厚道,只转一个笑话。

有人长期每天给一个乞丐施舍,但是近来施舍的钱越来越少。乞丐就问他为什么。那人答道,现在有了妻小,需要养家。乞丐大怒:“你怎么可以拿我的钱去养活你的家人?”

P.S. 对于经济学家这个头衔,不厚道地又想起一个笑话(见《广笑府》)

党太尉性愚钝,友人致书云:“偶有他往,借骏足一行。”太尉惊曰:“我只有双足,若借与他,我将何物行路?”左右告曰:“来书欲借马,因致敬乃称骏足。”太尉大笑曰:“如今世界不同,原来这样畜生,也有一个道号。”

read more

暮春三月

今天去波士顿城里办事,沿查尔斯河溜达了一个小时。春江水暖鸭先知,水上一对一对不少鸭子,想必那些可爱的小绒球很快就会出来了。然而依然绝少绿色,几棵柳树有鹅黄,写意而已。查尔斯河的水,四平八稳,气定神闲,不紧不慢地流。Iowa的水,似乎也是如此。此处的河水,和此处的时间一样,仿佛都比中国的流的慢一些。

三月将尽,在合肥或者蚌埠,都是油菜花遍野,暖和得让人直想睡觉的季节。脑子里反复都是这几句:

read more

《The Information》读后感(1)

The Information: A History, a Theory, a Flood》已经到了,从昨天晚上开始看。Amazon上只要$16,还有语音书版本。

看了两章,还是很有趣的。比如里面说非洲土著有一种鼓语,和莫里斯电码差不多,用高低两种音调模拟单词(这些语言里还没有字母),利用大约8倍的语义冗余,可以向几公里外传递信息。

我用Twitter写了一些很短的读后感,集中在这里,没什么次序。

In fact, semantic msg predated symbolic ones: paleolithic paints of horses expressed models of horses, rather than the word “horse”

read more

一些我最想看到电影

都是些和谐部不灭,拍不出来的

  • 靖康之变【去年读宋史,感慨良久,里面的种种细节,一定要拍成NC-17才能充分表达】
  • 崖山【彻底的亡国兼亡天下】
  • 李定国【和这个比,什么勇敢的心只能是垃圾】
  • 扬州!扬州!【十日;同时要充分表现南明的饭桶,彻底的饭桶,无论阉党还是东林党】
  • 郑和下西洋【这个不是盼拍出来,而是怕拍出来,活活糟蹋了一个大片的题材】
read more

张雷谈沃森,及我的感想

原文见:InfoQ: 张雷博士谈IBM沃森背后的AI技术 (作者 徐涵

不了解Watson的,先看这个视频

[youtube=http://www.youtube.com/watch?v=3G2H3DZ8rNc]

要点【内是我的读后感】

  • 沃森在拿到问题后,会进行一系列的计算,包括语法语义分析、对各个知识库进行搜索、提取备选答案、对备选答案证据的搜寻、对证据强度的计算和综合等等。
  • 它综合运用了自然语言处理、知识表示与推理、机器学习等技术
  • 搜寻很多知识源,从多角度运用非常多的小算法,对各种可能的答案进行综合判断和学习。以统计推理为主。【很值得借鉴的思路,乱拳打死老师傅,问题难,架不住方法多。人解决问题本来就没有一个统一的算法,所以有这样多的职业。】
  • 沃森以现有的非结构化数据为主,适当辅以一些结构化数据。尝试了使用Linked Data,特别是DBpedia、IMDb等【结构化数据成为主流,还有很长的路要走。最好的可能结果,应该是大多数Web数据都是非结构化的,加以结构化的摘要和索引。】
  • 沃森系统的一个关键步骤是评价备选答案的可靠性。这个可靠性是由上百个算法从各种不同的角度评价得出的
  • 具备了初步的自我学习和完善的能力。
  • 有些从文本中挖掘得到的知识是使用三元组形式表示的;当一个字符串代表的对象有歧义时,使用URI来代表不同的对象;利用RDF三元组中的谓词作为语义提示等等。【这些都是语法的形式,并不能说是语义网的技术。】
  • 简单的基于本体的逻辑推理,例如上下位关系、不相交关系(disjointness)等;几乎没有使用其它本体映射和转换。【能快速实现简单的推理,功莫大矣。单是这一块,单独推出一个推理机都可以卖钱,卖很多很多钱,前提是快,全Web数据1秒内可以响应。】
  • 并行化计算能力把响应时间从2个多小时压缩到3秒内。【这个现在已经不是独门绝技了,所以列最后一个】

Watson团队到RPI和MIT都来讲过,偏偏他们来的时候我都不在。Chris Welty给我们讲座,说好了Telecon,电话又掉链子。上周我们的头“韩”老师(有兴趣自己人肉)来吃午饭,和我们讲了半小时(他也是听Chris说的)。Watson现在很重要,项目评审的时候,如果有Q/A方向的,大家都会问:有了Watson,你还研究啥?杯具啊!

read more

错错得正的错读字

汶莱的“”,正音读wèn(问)。汶川大地震,大汶口文化,都读wèn。读wén(文),错,唯独在“汶莱”中,恰读wén。无他,约定俗成,汶莱当地的华侨都这么读。

浒墅关的“”,正音读hǔ(虎)。水浒读成水xǔ(许),是要被笑话的。唯独在“浒墅关”中,读xǔ。据说是乾隆爷当年读错了,也是约定俗成,从此就将错就错了。