我们曾邀请唐铎普特到现场来参与我们的访问,但由于没有取得学车执照(learner’s permit是美国考驾照的前一步,与国内交规考试的差别就是拿到学车执照的人就可以上路了,不过必须要有驾照的人坐在旁边),因此唐铎普特最终没能成行。对于唐铎普特的难处,我们感到十分理解。因为唐铎普特不仅需要频繁参加学校举办的各种辩论赛、上课、与朋友出行游玩,而且他大部分的业余时间都被花在了自己于年前推出的一款精品阅读应用“Clipped”的开发工作中。
当下新闻阅读类的应用不胜枚举,部分应用的用户体验十分出色,其中就包括大名鼎鼎的新闻聚合社交应用Flipboard。除了Flipboard以外,还有无数的初创公司投身于这个领域,比如Zite、Cir.ca和Summly。不过,由唐铎普特开发的Clipped应用的主打功能却很有意思,那就是自动帮助用户过滤无用内容,然后根据关键信息给出一个简练的内容摘要。用户只需要提交一个文章地址,Clipped就会利用基于自然语言处理的智能算法过滤掉没有太多意义或者不重要的细节内容,通过统计和关键字的组合分析,Clipped能够对信息块的重要度进行排名,并选出那些关联系数最高的句子。然后,Clipped根据分析结果生成内容摘要,最后还会重新读取自动生成的摘要进行分析,以确保选定的信息内容是合理的。然后,该应用才会将最终结果呈现给用户阅读。一般来说,一篇文章经过Clipped过滤之后只会剩下三句话左右。
Clipped对“精简”的理念贯彻的十分彻底,他们甚至在Clipped应用内部内置了一个新闻摘要检索功能。这也就是说,即使被Clipped精简过的文章内容已经很少了,开发商还是认为其中包含了部分用户不感兴趣的内容,所以Clipped允许用户根据自己的兴趣输入关键词进行检索,也就是让用户对已经精简过的内容再进行一次主动筛眩目前,Clipped已推出Android版和iOS版应用,同时推出了桌面版的浏览器插件,可支持Safari、Firefox、Chrome和IE浏览器。此外,Clipped还为开发者提供了API,开发者可将Clipped的功能内置到自己的应用中。
唐铎普特坦言,自己对自然语言处理技术非常痴迷,自己最初开发Clipped就是为了让自己在学校的辩论赛中可以以更快的速度阅读到有用信息。所以,当他最初设计Clipped时,就考虑到了要让用户一开启应用就可以立刻看到最重要信息这一方面。不过,唐铎普特也坦言,目前的Clipped还远远称不上完美,仍然有着许多需要提高的地方。
日前,我们有幸采访到了唐铎普特,以下是本次专访主要内容:
扎克斯:你是怎么想到开发Clipped这个点子的?
唐铎普特:我是一名十分热衷于“林肯—道格拉斯”式辩论(The Lincoln-Douglas Debates)的辩手,因此在每次辩论前我都需要进行许多准备工作,这一过程十分冗繁。因此我产生了让一篇文章浓缩成短小精悍短文的想法。去年,我编写出了基于自然语言处理智能算法的第一个版本,然后花了去年一整年的时间对此进行修改。最后,我认为这一算法不仅适用于辩论领域,而且还适用于新闻文章及其他文献的阅读领域。
扎克斯:部分用户反映Clipped的文章精简功能有时并不好用。
唐铎普特:新版Clipped中的自然语言处理智能算法主要针对长度在一页至两页之间的文章,目标文章风格主要是叙述性或信息类,而不是主要针对阐述观点类的文章。不过,目前我正在针对阐述观点类的文章对这一算法进行优化。
在一个普通的上课日中,我在回家后通常会先做3、4个小时的家庭作业,然后同朋友出去玩1、2个小时,最后才回家利用一天中剩余的时间处理Clipped方面的工作。
扎克斯:当你在为自己的辩论赛而开发这一自然语言处理智能算法的时候,你自己是怎么使用这一工具的?
唐铎普特:以前,我通常会快速阅览许多文章,如果我喜欢其中某一篇文章的话会从头开始阅读。比如,在一场普通的辩论赛中,我手头大约会有100份长度在二到三页的文章资料。其中,有部分文章的标题或许十分有吸引力,但在经过Clipped精简后我们通常会发现文章的中心根本不是我们所需要的内容。去年,我曾参加过一场有关“保障动物权利”的辩论,期间我找到一份有关这一话题的文章,但这篇文章的重点是讨论“保障动物权利”哲学方面的意义,但我所需要的是“保障动物权利”在科学方面的根据,比如“有研究发现动物可以和人类一样进行思考”这样的内容。
扎克斯:最近我曾接触过一个19岁和20岁的年轻创业家,但你是我所见过最年轻的创业者。这个月你就将年满16岁,你有去申请“学车驾照”的打算吗?
唐铎普特:还没有,或许我会在这个夏天考虑这方面的事情。
扎克斯:你是不是应该更多的参与高中生的日常活动,比如约会、参加舞会什么的?在高中的时候就将精力投入到Clipped是不是很难?
星期五, 04/11/2014 - 10:37
#1
15岁高中生开发阅读应用 智能算法拥自主专利
没有年龄限制
老外的 小孩就是犀利! 动手能力强!
自然语言处理
外国小学生 很犀利啊!
自然语言处理的智能算法过滤掉没有太多意义