整体认读(ReadCog)

作为Google Reader三十年老粉……

已经不记得2013年停止服务的UI和UX了,只记得是JQuery写的,界面朴拙,但很好使:第一次出现可以同步的个人新闻订阅——每天清空未读数,成了诸多互联网强迫症的一种。

但虽然用户都是我这样的忠诚用户,Google在13年还是关闭了Reader,对外宣称是RSS属于“上一代”信息获取方式,新推出的Google+/Google Now会在个性化和主动性上给用户以全新体验——(2019年,继任者们都已经关闭和改名了)

同样都是公司内部创业项目,Gmail得以保留并且成长为拳头产品,因为面向大众,大众们邮件里的信息流也多种多样,有利Google主业:卖广告。而会在Google Reader里给自己组织并消费信息的都是精英玩家,不但小众而且内容也是垂直有限的,能卖出去的广告关键字实在是……还是关了吧。

有人撰文专门为此较好,指出“人工订阅模式没能满足大部分人的资讯需求”,更适合大众的,是“基于算法的个性化推荐”,于是有了“今日头条”,在Google Reader倒掉之后,把向大众卖新闻关键字广告的大生意做成了。

信息太多和太少

任他沧海横流,起高楼宴宾客,新闻我还是要看的啊,好在Feedly/Inoreader/NewsBlur等面向小众的服务还运营得不错,我一直用Feedly也挺顺手的,但13年有人说过的矛盾还是存在:一方面我订阅的内容不足以覆盖所有的兴趣点,遗珠就是遗憾啊(“有遗憾你才会记得我”),但加大订阅量,信噪比就会被稀释降低,毕竟时间宝贵。

“整体认读”作为工具服务,提供如下功能:

  • 用户组织并消费信息
  • 提高信息的信噪比

如何提高阅读信息的信噪比?毕竟“天之道损有余而益不足”,反其道而行之的方法目前主要有俩:一是靠人工,别笑,这篇文章的看官,有很大几率是《湾区日报》的读者。在我看来这是中文TMT界最佳信息源——人工推荐的。就是进入19年后创始人兼总编大人因为工作太忙更新率下降,以至于我一度想去催更——醒醒,这不是在起点啊喂!

二是人工智能,每当看到Google展示黑客帝国般的GPGPU农场或者今日头条演示用GAN换脸——几大IT公司伺候咱一人儿,这福分还小吗——那还能小喽?前提是真的在为读者计算。

Google 18年初财报显示,盈利77亿美刀,收入的84%来自广告业务。能把广告推送得精准,全靠软硬件基础设施:做免费的安卓系统,装在手机里成天跟着;搜索引擎知道每个搜算关键字和搜索地点;U管提供内容消费和偏好数据…一句话,移动操作系统、搜索引擎、视频网站,全都是这家广告公司的实体业务。

但是,广告公司的用户,并不是读者,而是投放广告的客户啊!读者是产品的一部分,能提供上述数据的精准程度,直接决定了这块媒体的广告价值。在公共关系学里,有两个基本概念“知名度”和“美誉度”,对广告公司而言,“知名度”就是一切,比如在微博上买流量,捧你还是踩你,都是N块钱一条——骂战没准都是大V双方商量好的,一次能省好几十万推广费用呢。Google Reader就是一个在小众精英团体里“美誉度”很好但是面向大众“知名度”不佳的产品,在广告公司里当然只有寿终正寝的份儿了。

——但作为Independent Service Vendor,可就不一样了!只要有少数兴趣相投的用户购买服务,就可以生根发芽,茁壮成长。

愿景

ReadCog的愿景,是能对解决以下三个问题有所贡献:

社会关系疏离

和自己核心社交圈子之外的社会联系,会像红移一般,平常不会注意,但迅速远离,作为一个个割裂的群组,最后失去联系——本来可以丰富自己的世界,但却在眼前消失,真可惜啊!人作为群居动物,必须依赖社会的共同努力,如果有人信心爆棚到觉得自己可以一力承担荒野求生的重任——贝爷还有摄影师,鲁滨逊还有星期五呢。

作为一个正常的白领,获取信息最有效的方式通常是中午和同事们吃饭时吹牛,稗官野史、外星科技无所不谈,第一是提供了相对封闭的空间和听众——点完菜等着也是等着;第二是上午摸鱼时看了新闻,不吐不快。ReadCog模拟了这两个条件:邀请关系可见的点评,以及精选后用来点评的最新RSS feed(当然可以自带OPML)。

信息内卷

做研究最悲惨的莫过于花了一年准备论文,发布前一天看了一眼最新期刊,发现有人已经发了……三峡大坝建成后发表已经在水线以下的“小小三峡漂流tips”同理。即便每天和同事吃饭团建,接触的信息也相对固化——毕竟人数有限,每个人的兴趣爱好就那么几个,时间长了信息量和一个人没本质区别。然后就不可避免地庸俗、过时和退化了,美国文化人类学家克利福德·格尔茨称之为“内卷(Involution)”,既无突变式的发展,也无渐进式的增长,长期以来,只是在一个简单层次上自我重复。具体可以参考大清的小农经济,虽然GDP高举世界前列,但能动员的力量微不足道。

而解决内卷的方案也很明确——引入外部资源。远的大清搞洋务运动后立马有了“同治中兴”,灭了太平天国,保住了西北,把大清朝盖棺材板推迟了几十年;近的大家都清楚,就不多说了。未来还有一带一路和人类共同体,大有可为啊少年们!

具体到ReadCog,就是根据一系列方法(包括但不限于:NLP/CF/LDA/LSI/贝叶斯/人力)向读者推荐以前从未看过的内容。

用户画像

别想了,用户画像是不可避免的,在信息时代比死亡和纳税还要不可避免。但有主观能动性的人们还是可以做一些事情,比如给我们每日阅读的信息源画像:A经常发些“恰饭”文,比率高达70%;B就好多了,只有5成的文章有“恰饭”味;C就更牛逼了,从不“恰饭”,专发良心干货…

《硅谷》里Yang的Hotdog应用已经成为了AI落地的一个梗:训练模型辨认热狗,就只能辨认热狗,想辨认披萨就得重新训练,毫无启发性。好消息是,今时今日的技术,辨认垃圾短信已经可以达到9成以上的成功率,辨认“恰饭”文嘛,也大有可为。

总结

靠一个软件服务解决上面这三个问题,那是不可能的。但是能够帮助用户在降低熵的方向上做哪怕微不足道的一点小事,也足慰平生了。