首页   

年度最火 AI 工具更新了,知识以一种神奇的方式进入大脑

APPSO  · app  · 3 天前

主要观点总结

文章介绍了2024年最受欢迎的AI产品NotebookLM,该产品具有智能笔记和播客对话功能。文章详细描述了其新功能“加入”,并讨论了其使用体验和潜在改进点。同时,文章还从科学角度探讨了阅读能力和声音敏感性的关系,解释了NotebookLM受欢迎的原因。

关键观点总结

关键观点1: NotebookLM的爆红和其智能笔记、播客对话功能以及新推出的“加入”功能紧密相关。

该功能允许用户参与播客对话,并得到了用户的广泛好评。

关键观点2: NotebookLM的“加入”功能具有一些限制和改进空间。

例如语音识别有时会出现问题,生成时间较长,加载不稳定等。

关键观点3: NotebookLM在处理长文本方面表现出色。

上传文件后,它会自动生成概览性总结,并允许用户根据上传文本内容提问。

关键观点4: 医学研究表明阅读能力和声音敏感性之间存在关联。

这解释了NotebookLM之所以受欢迎的部分原因,因为它结合了声音和文字两种模态。


正文

2024 年最受欢迎的 AI 产品,当属 NotebookLM。从九月开始就一路爆红,一直到年末热度都居高不下。
12 月时,NotebookLM 更新了新功能:加入。用户也可以成为播客节目里的一环啦。
这个功能并不是刚刚面世,很早之前 NotebookLM 团队就在 Google 开发者大会上展示过,只不过最近才终于有了 BETA 版。
前排使用指路:
https://notebooklm.google/
注意:
对部分地区用户有强限制,注意检查自己的网络设置
「加入」功能使用不稳定,多点耐心
「加入」功能目前只支持英语发言,上传文本的语言不受限制
目前只支持网页版,没有移动端
不仅一键生成播客,还可以加入
NotebookLM 最早主打的是智能笔记,上传文件之后会自动生成概览性的总结。用户可以在对话框里,根据上传文本的内容,直接用文字提问。
其实这个功能也是不错的,当然,它真正出圈的是播客形式的对谈,也就是音频概览。现在,音频概览还提供「加入」功能,点击可以直接加入这场对话。
提问,是这款产品最大的亮点。上过课的都知道这里面的门道有多深:提问不仅要求你对内容有所了解,更重要的是,为了参与和加入,必须得主动跟上节奏听讲,且开动脑筋。这样有效地促进了对文本和材料的理解。
关注 AI 第一新媒体,率先获取 AI 前沿资讯和洞察
NotebookLM 的「加入」,像腾讯会议里的举手功能。点击后直接说出问题,大概延迟个一秒半秒,AI 主播就会响应,会说类似「我们的听众朋友有话要说」来过渡。

目前看需要一些响应时间,但接话非常自然。语言只支持英文,所以需要用英文提问,但即便用中文提问,也会非常友好的感谢你的参与,不会让话掉地上。
NotebookLM 对长文本的支持非常惊人,《战争与和平》这样的大部头也可以上传。虽然从生成的音频中,可以感觉得到应该是只摘录了部分章节用来做分析,总长只有 11 分钟。
也可以理解,讲完全本不得好几个小时啊。
测试使用的《战争与和平》是中文版,返送的音频概览是英文,不过在开头,两位「主持人」特地指出这是一个中文译本,并且表示从不同的语言,可以提供不同的看待故事的视角——非常正确!
当问及具体用到了哪些章节用来分析,对面有点模棱两可,表示自己选择了一些关键的情节。音频中,也是根据按照人物的顺序来讲解,而不是故事情节。
不过,分析的内容可以自定义,在生成音频概览前,点击下方的自定义,输入自己的需求即可。比如在上传了另外一本小说后,我要求以故事发展的情节作为主要关注点,后续生成的音频就完全是按照故事剧情的顺序了。
在提问环节里,我发现它的语音识别会有一些问题。比如在下面这个问题里,原本我的问题是这本小说「novel」里的人物是如何塑造的,结果被识别成了贵族「nobel」的人物是如何塑造的?

也没有向我核实,这种失误延续了大模型一贯以来的风格:一本正经地跑偏。明明理解偏了,但还是认真地继续着讨论,而且说的头头是道。
另外还有一个问题是交互的设计。NotebookLM 的初衷是好的:每一个项目可以容纳不止一个材料,这样可以综合不同的材料来生成笔记。但是在界面设计上不够清晰,哪怕只是加一个「回到所有项目」这样的图例,都会好很多。
另外还有一处交互的不妥是,进入互动模式后,音频是没有进度条的。一来这样很影响判断目前节目进行到哪里了,二来是提问完成后不能倒回去听,提问本身也不收录进音频文件里。只能说这还是 BETA 版,期待后续的升级吧。
目前看来,长文章的效果是最好的。生成的时间比较友好,而且可以阅读完全文。比如《战争与和平》这样的大部头,虽然也可以传进去,但生成真是花了好长时间,一度以为它卡住了。
而长文章不仅模型吃得消,也最能够把这种互动的优势发挥出来。
长文章部分,我跑了一篇两三千字的文章,主题是对 AI 聊天机器人潜在问题的讨论。完整音频总长 22 分钟,不过,这是已经包含了好几个提问在内的时长。
再短可能没什么信息量,再长难免让人没耐心。20 分钟带互动,可以说是比较合适的长度。

不得不说,这个互动的自然感,还是很惊人的。不仅是在语音上,也体现在内容上,两位「主播」非常准确而且全面的理解了问题。
不过,实际上这些问题在原文章,没有直接的解答。如果是针对原文内容提问,如果能用上「在本文里」这样明确的表述,会更清晰一些。
但正是这些超脱原文的发挥,展现了背后模型的实力:一方面,模型要能理解问题,第二判断是否有原文的支持,在没有的情况下,生成合适的回应并转化成语音,还得包装成自然流畅的语音互动。
聊天机器人有没有这么仿真不好说,我看这俩主播是真的挺强的。
无痛学习是怎么做到的?
NotebookLM 的产品经理 Raiza Martin 在接受采访时表示,她有点意外于现在的火爆程度。一开始,这并不是一个面向广泛大众打造的工具,更多的还是面对阅读爱好者。
这里头还真有些科学道理。
医学期刊《神经影像》最近发布的一项研究,可能解释了它之所以火爆的原因:爱阅读的人,恰恰对声音也更敏感。
你可能会觉得有点困惑:阅读不应该是跟「看」有关、跟视觉有关吗?
对,但不全对。阅读能力和大脑的左半球颞叶前部有关,而这个部分也处理声音。处理语音的意识早在儿童时期就有了,我们先了解语言的声音,再将文字与语音配对。
研究人员在对超过 1000 名志愿者进行测试后发现,左半球里其中一个大脑回路,厚度越增加,口语和阅读能力越好。而这个大脑回路,也包含了听觉皮层。
也就是说较厚的听觉皮层,与更熟练的阅读能力相关。这并不完全是天生的,我们的大脑时刻在被环境改变。越多的阅读行为,会慢慢地改变大脑脑皮层的形状。
当然,播客这个形式的有趣和生动,也是重要的原因。NotebookLM 把声音和文字两种模态结合起来,但又不晦涩,受欢迎也很容易理解。
除了用来分析文本,网友们还开发了 NotebookLM 的各种神奇用途:用来改简历、互评论文、模拟小组作业讨论。读书简直就是最微不足道的一环。
不过现阶段 NotebookLM 还有很多可以提升的地方,比如语音有时候还是会卡顿、生成时间较长,以及时不时就加载失败。希望它不要辜负大家的期待,抓紧优化啊。


© 2024 精读
删除内容请联系邮箱 2879853325@qq.com