回国后第一次看病

昨天第一次去医院看个小病。我是脚疼,去医院拍了个X光,医生说没大事,软组织伤,拿点膏药就回家了。前后3个小时,其中2个小时是等X光片,溜回家看书了。前后挂号费42(自付2块),X光费105(无自付),药费210(无自付)。

还是会不由自主和美国做些比较。如果在美国,首先医院肯定不在步行范围内。根据以前的经验,我这种情况大概要去四次才能搞定:第一次去家庭医生,第二次家庭医生推荐后去专科医生,第三次专科医生批准下去专门的放射诊断所拍X光(几天到一周拿结果),第四次再去专科医生处获得诊断结果。每次都要预约,前后正常估计要2周能搞定。

read more

公开数据的一些零碎

把一些和公开数据有关的微博汇总了。没有整理,先放这。

——————————

公开数据是当代最重要的基础设施,是和高铁一样的国家核心竞争力。只是现在各地被虚无缥缈的大数据忽悠,对公开数据的作用、内容、产业链都了解太少了。

公开的数据没有真正地开放出来,这极大阻碍了中国金融服务业的发展。在投资机构中,很多金融实习生还做着把非格式化的PDF文档包括公司报表、研报等等,整理为Excel、PPT等其他格式的工作,这种机械的“脑力体力劳动”在当前时代是必须革除的

read more

什么样的人适合在早期初创公司工作?

2016-03-11

最近半年见了很多的人,各种不同类型的人。我一直在想,愿意在早期初创公司工作的人,他们是什么样的人?

这个问题和“创业的人是什么样的人”还不太一样。那个问题要更复杂一些。(我用Mattermark的数据做了个拍脑门的数量级分析,觉得这个世界上大概只有千分之一的人适合创业)

这个问题和“什么样的人适合在初创公司工作”也是不一样的。因为所谓的“初创公司”(startup)是非常不同的很多公司的总称,一两个人的公司是startup,上万人的公司也被称为startup,他们是完全彻底不同的公司。什么是早期初创公司?我觉得就是大家还可以在一张桌子上吃饭的公司。

read more

一个自然、进化、认知的书单

今天被布置了个作业,要一个自然、进化、认知的书单。下面这些是一些过去两年我看过的书,都是看完了以后觉得还不错的。当然挂一漏万,没看过的好书还有太多太多。

<私货>
我们能存在是很神奇的事。作为只占宇宙0.03%的痕迹,构成我们、水、大地等等的一切(重物质),无非是若干亿年前一次超新星爆炸的残留。在这痕迹中,又发展出一种更微量的能提高自身有序度的物质运动。这些物质的集聚,导致了进化。认知,社会,亦都是进化所成的衍生的表现型。这些东西,或亿年后,或数百年后,又会被毁灭,又会有新生。即使是今天,理解我们的由来亦有助于理解我们的局限,以及如何在这Matrix中生存并成为病毒。

read more

知识图谱开发的核心是迭代

《爬升知识图谱技能树》 http://vdisk.weibo.com/s/qDHytUlgU_Pb

上次的讲座提 到知识图谱开发的核心是迭代,稍作补充:线上可用的系 统,一般经过统计、规则、编辑三步提取。统计方法粗过一遍,但一般难以达到可用程度,后面还是要靠人工。规则是可重复的人工投资,编辑是不可 重复的人工。迭代就是提高可重复的人工投资的比例,并反馈到统计系统

拿炼 钢做比喻。统计相当于选矿,提供些可用的原材料。规则相当于炼出铁,勉强可用。编辑相当于锻打,让材料达到做零件可用的特性。我们要用各种方 法来改进炼铁和锻打的效率,但是这不是加强选矿就能替代的。有多少人工才有多少智能。

read more

最后的记忆

这是最后一个了。

 

当X3D7开始提取眼前这个人类的记忆的时候,它只是基于程序的本能。它并没有意识到,这是最后一个可以用于提高“社会机器”有序度的大脑。它没有意识这个东西。

最后一个还保存有人类记忆的大脑。

提取记忆需要一种非常复杂的过程。在早期,机器刚刚获得对人类的优势,按人类纪元大约2100年左右的时候,复制大脑曾被认为是一种合理的方式。毕竟,当机器可以精确到纳米来扫描脑细胞的连接,测量脑细胞的电位,最直接的想法就是用机器来模拟这些连接,以电子的方式复现这些不可靠的生物记忆。

read more

记忆的互联

(1)Memect的愿景

Memect成立两年多了,现在准备要进入一个新的阶段了,我觉得有必要来解释一下,当初要离职开始做这件事情的愿景是什么,以及我们打算通过一个什么样的路径来达到这个愿景。

当然,对大多数人,这个愿景可能是无所谓的。以前我们也只和很少的亲近的朋友聊过。在具体战术上,也许不必拘泥于这个愿景;不过愿景这个东西,说它不重要也不对,它代表了一个努力的方向,也许我们永远都到达不了那里,可是它会给我们一个导引,让我们不要在纷繁芜杂的噪声中过于迷失。一个有意思的愿景,在我们面前挂一个胡萝卜,引诱我们未来可能有什么特别有意思的事情在前面。做创业,最重要的驱动力不就是去做有益而又有趣的事吗?这是各种快乐的源泉。

read more

碎片知识符合人的本性

看《长期接受碎片化知识的危害》一文,有不同看法
我觉得,各种媒体一出来的时候都会被人认为是浅薄。柏拉图就说,文字使人不努力思考,因为原来需要记忆的东西现在不用记了。Web出来的时候,“上网”也被看做不务正业。人类的认知,本来就是一层一层发展起来的,从5万年前的语言革命,到5000年前的文字革命,到500年前的科学革命,到50年前的计算机革命,普通人的大脑并没有什么变化,认知那些最耗能的部分,越来越被外部的存储和计算取代。人有天然的希望降低信息处理能耗的本能。碎片化知识本身是符合大多数人接受信息的成本的本性的。如何顺应这个本性,用机器帮助人们从碎片中系统化知识,是我们知识工作者的使命。

read more

把科学剃掉的朴素奥卡姆剃刀——谈谈科普

 

认知的朴素奥卡姆剃刀

基于人的大脑这个近几万年没怎么进化的物理载体,科学才是流沙上的大厦。人类若不能保证社会的有序化,时时刻刻都有滑回迷信主宰的原始社会的内在趋势,因为那才是我们的生物性渴望的状态。这是人作为智能体最大的弱点。

人类有四套认知系统:原始的爬行动物认知系统,5万年前语言成熟时发展的,5000年前文字发明后发展的,和500年前科学兴起后发展的。每一套都比前一套更不“自然”,更耗费能量,速度更慢。所以人总是倾向于用低层次的认知系统。这也许能解释90-9-1现象。

read more

100年以后的人类社会会是什么样?

#百年设想#

一)100年以后的人类社会会是什么样?

我本来想写“未来的人类社会是什么样”,但是不加一个时间限制的话就是耍流氓,写的太短又容易被打脸,所以选100年这样比较适合纯娱乐。

我想对社会未来的幻想,也可以类似罗辑的宇宙社会学,从一些简单的假设出发。

二)假设1:养育身心健全的婴儿和教育儿童还是需要人大量劳动,机器不可替代

假设2:人的通讯速度大大低于机器

read more

马,印欧扩张与周商革命

马,印欧扩张与周商革命

2002年2月16日
2002年12月2日修订


(殷代甲骨文:马)

1 前言

从公元前二千纪初起, 几乎在蒙古-青藏高原以西的整个欧亚大陆, 发生着也许是人类历史上最重要的一次种族扩张, 这就是在从印度到西班牙的辽阔土地上, 原始印欧人(Indo-Europeans) 都开始逐渐替代当地居民.

除中国外三大文明中心的衰落都和印欧人的崛起有关. 埃及的古王国由于喜克索斯人的入侵而结束, 喜克索斯人虽然并非印欧人, 但他们从地中海东岸西侵, 却有极大的可能是受了当时从小亚南下的印欧人,例如赫梯人的压力, . 到公元前6世纪, 埃及人被印欧人的另一支波斯人(Persians)灭掉; 古印度被雅立安人(Aryans)灭掉 ; 巴比伦688BC亡于亚述(闪米特人Semitic )612BC亚述又亡于Medes(米底)人. 波斯, 雅立安和米底人又都是印欧人.

read more

思考是一种令人作呕的东西

在恐惧或者贪婪被激发的时候,思考就变成了一种令人作呕的东西。(西瓜日报 2015-03-03

下面是一个具体的例子 http://www.weibo.com/1876582681/Cc8jL2jVt

(这里对原文的倾向不做判断,仅仅做一个传播学的脚注。这是任何一个倾向的人在网上都会遇到的事)

部分读者的留言:`

​大傻逼还在现

这是最初级的喷

 

原PO读书读到牛屁眼里去了

你国有人大,非职业代表,全职业装逼

略微用心的喷子

read more

从大数据到小数据

本文原文:http://baojie.org/blog/2015/04/05/from-big-data-to-small-data/

今天参与中国计算机协会YOCSEF举办的从硅谷看IT技术未来发展趋势论坛。其中panel discussion阶段谈大数据时代中国的创新机遇。这里记一下我的立场。

1) 数据的发展,看过去五十年的历史,是分久必合,合久必分。大数据往后发展,十年以后是什么样?我想是再度去中心化,从现在数据中心化的,企业端,数据中心端的存储和分析,成为一个分布式的系统。数据产权的概念会清晰起来,来支持数据交换,或者说数据市场经济,这样一种分布式系统。

read more

周期性的破坏重构是一种必然

我读东汉晚年政治,也颇感一个稳定良好运转的政治体制,在各种利益集团形成后,不管当初的设计多么优秀,也不免不能行动(福山称为“政治衰败”),半身不遂。盖执行比制度的明文重要,而执行不能离开具体的人或者机构。周期性的革命和破坏,于是不可避免。美国文明也不会例外。

【张维为:福山眼中的美国病】四年前,福山携新著《政治秩序的起源》来上海,与我有过一场关于中国模式的辩论。四年后,他又携新著《政治秩序与政治衰败》来华,与中国知名政治学者李世默在观察者网进行了一场很有意义的对话……http://t.cn/RAboc3m

read more

微信能构建新web世界吗?(1) 历史总是重复两次…或者三次

微信如今如日中天。如果说2013年的话题还是微信能不能取代微博,从2014年开始,话题已经变为因为有了微信,“不需要搜索引擎”,“不需要电子邮件”,甚至“由微信构建的新web世界”这种级别了 [1]。

历史总是重复两次…或者三次

这种“由x构建的新web世界”的话在Web世界里我们并不陌生。甚至早在还没有公开Web之前(也就是1991年之前),已经有了因特网服务提供商ISP,比如CompuServe和美国在线(AOL)。他们提供了类似Web的服务,用户可以在他们的系统内看新闻,聊天,下载软件,甚至订机票。他们试图为用户提供一揽子的信息服务,希望用户可以舒适地在一个封闭花园里生活。但是Web的出现一下子就打破了这种幻想。ISP的“准Web”在全球性Web的冲击下很快就销声匿迹。AT&T抵抗到最后,据说前后投入了600亿美元,进行各种收购和开发,想建立一个“由AT&T构建的新web世界”。这个计划完美地失败了,老AT&T也就此破产。

read more

无为、无事、无味,才是个好知识管理系统

老子曰:图难于其易 ,为大于其细 ﹔ 天下难事 ,必作于易,天下大事 ,必作于细 。是以圣人终不为大, 故能成其大 。

这句上的上一句:为无为,事无事,味无味。我体会这就是知识管理的核心,就是不要生事。任何人都有自己的习惯和价值观,一定不要试图去改变别人的现有行为。让每个都按已经习惯的方式去做事(至少一开始),然后知识管理的成本就降下来了。无为、无事、无味,才是个好系统。

read more

战略的错误与战术的弥补-天国反思录

战略的错误与战术的弥补-天国反思录

(1) 定都天京

2002-06-08

战略的错误是不可以用战术的努力来弥补的.

太平天国选择在南京定都无疑是最大的战略错误. 以当时太平军势如破竹的进军, 攻克南京后直接进攻北京, 清政府几乎是没有办法的: 无兵可用, 无将可使. 但是洪教主定都南京恰恰挽救了清政府.

所谓六朝古都,龙盘虎踞, 只是字面上好看, 在现实的军事考验前, 南京在历史上就几乎没成功过. 为了南京的安全, 必须进行西征, 控制上游, 为了百万大军的生存, 必须建立根据地. 从全国的战略来看, 北伐是最重要的,  但从南京的生存来看, 西征却是最重要的, 最后不得不牺牲了北伐而将石达开这个预备队用于西征方面, 最后的结果是北伐先胜后败, 而西征先胜后败(遭遇湘军)最后胜利. 但是西征的胜利在全国战略的角度, 依然只是一个战术性的胜利, 太平天国已经从主动走向了被动, 无论是武昌, 九江, 安庆, 还是后来的常州, 苏州, 杭州, 一切战事的核心思想就是拱卫天京, 一切军事行动的最后原则就是有利于天京的安全.

read more

关于知识管理和语义搜索的一些思考

知识管理的坑

做知识管理最容易陷进去的坑就是满足1%用户的要求

做知识管理最容易陷进去的另一个坑就是满足99%用户的要求

知识库的构造中,当目标是满足全人类的需要,就没办法满足(几乎)任何人的需要。Wikidata, freebase, dbpedia和yago都有这个问题。

wikidata至少做对了一件事:不用RDF

众包是一个建设文本百科的好办法,但是对于建设结构化数据就没有成功的先例,因为世界观的冲突很难用结构化表示融合。详见我的《The Unbearable Lightness of Wiking》http://www.slideshare.net/baojie_iowa/2010-0522-smwcon

read more