找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 7|回复: 0

RPA+AI硬件,我掌握了钉钉首款录音卡片的正确打开方式

[复制链接]

113

主题

0

回帖

359

积分

管理员

积分
359
发表于 前天 11:00 | 显示全部楼层 |阅读模式
我好像有点理解为什么买AI硬件会上瘾了,

这种感觉就像是日常想换个手机壳、换条手表带、换个电脑贴纸啥的,

所以最近想把预算范围内能买到的AI硬件,都买回来试试看,做成系列测评。

那今天测的就是钉钉十周年推出的AI硬件,

DingTalk A1 录音卡片

关于AI录音卡片的争议性非常大,Plaud Note、出门问问的TicNote,和这次的DingTalk AI,

可以这样说他们基本已经把这个卡片的硬件形态卷到头了。物理录音按钮+状态显示屏,就算让我,让GPT来想也很难再给这几十g重的卡片塞点什么。







所以我把关于AI录音卡片的全平台的吐槽都收集了一遍,总结出来几大槽点:

真的,大家的吐槽真的都太real了,Apple Watch路过都被吐槽一嘴。



那钉钉解决了哪几个问题呢?

长话短说,

DingTalk A1这次主打的是连续录音45小时、TypeC充电口(其他家是专用的四针脚的充电线)、8米清晰拾音、21种语言同声传译,8种语言实时互译、每个月有1000分钟的免费额度,价格有两档799和499。

很好,这次大概率不会在抽屉吃灰了。

这周的高频率使用下来还真让我发现不少好用的场景。

第一个解决的问题还真就是为什么我会专门随身带一张AI录音卡片,

就是因为手机在外掉电太快了,我现在随身是一台iphone16pro和一台readme k80,k80的镜头拍摄像素不太够,所以主力用的是16pro,再加上出门的时候噪音源很多,我基本上都是连着耳机的。种种结合起来,我的电量基本不会高于40%,太烫了。

这时候如果我要记录一些todo,尤其是每天快5000+信息的微信,我真的我出门的时候就怕因为弹窗不小心打开999的群消息,当下没时间看,比起用微信自带的消息定时提醒,我更喜欢按照话题来划分,临时用语音记录一下有什么值得后面二次翻看或者回复的。

DingTalk A1有两种记录方式,

一种是语音备忘录,就适合几句话几句话的临时消息,需要按住一个按钮,有点像发一条语音给钉钉一样,

而另一种长录音模式就适合把卡片放在固定的地方,我临时离开或者分神的时候也不会漏掉信息。

硬件基础,交互方式就不基础,

除了基础的转写、纪要、章节外,DingTalk A1 背后的软件能力里还有一个专门留给AI助理的分析功能。



这里的AI助理不是我们常见的AI角色,它不依赖给AI赋予不同的角色背景、不同的音色、不同的虚拟形象,这种做最多就是加点情绪价值,对AI录音这个场景没什么实际意义。

这里的AI助理更像一个简化的RPA,当录音里面有对应的关键词,就可以触发有不同能力的AI助理,而且AI助理输出的内容可以写入AI表格,我看到这个功能我第一时间想到的就是用在发布会视频总结。

我最近想给买一个除猫毛的空气净化器,但是对应的测评视频太多了,看不过来,这时候通过AI助理就能将多段录音里对同一个物品的评价信息写入到一张表格里。光这个功能我觉得就已经值回一半的票价了。



DingTalk A1能直通钉钉还是有不少好处的,

很多功能都不需要从零开始做,上来就是一套成熟的工作流。

当我结束一段录音,这段音频会在钉钉里被迅速转写成文字,通过声纹识别自动标记出不同的发言人。然后,我可以套用AI听记里预设的36种纪要模板,选择课堂笔记、客户沟通或者头脑风暴,迅速提炼出核心要点、待办事项和会议摘要。

DingTalk A1还有一个可视化录音界面,在回听录音的时候可以帮我回忆一下当时发言人的顺序和距离,我觉得用在圆桌或者狼人杀复盘的时候嘎嘎好用。



到这里还没有结束。AI识别出的待办事项,可以自动同步到钉钉的系统待办里,指派给相关的同事。生成的会议纪要,可以一键分享到工作群,成为团队共享的知识资产。

这样一套从录音到笔记到任务分配的完整工作流才值得我额外付费。

我这里也贴一个完整的对话记录,大家可以直接听到实际的录音效果和各种AI功能的输出。

shanji.dingtalk.com/app/transcribes/76327569643135323037343935325f313631373031333130355f32

再说说最关键的拾音和转写质量,

拾音这个我必须说是我的踩坑史,我在室内拍摄之前用的是一台备用机iphone12mini收音的,说实话效果不差,比一般199那些纯蓝牙麦克风好二十倍吧,但是放在室外就不行了照样破音。

室外的拾音又分两种情况,长时间固定位置比方说线下分享会,发言人离我很远,这时候用有接收器的麦克放的效果不算好,耗电量也高。

按照说明书来说的话DingTalk有6颗麦克风支持8米左右的拾音,像是cursor in hangzhou那种比较小型的分享会就非常非常非常非常合适,把卡片贴到演讲台(我的信息记录邪修方法,一般人我不告诉)

这次 DingTalk A1 对接的模型是通义实验室和钉钉合作的语音大模型FunASR,模型本体学习了大量行业术语和词汇。我特意在录了几个OpenAI播客的内容来看看效果,基本上人名和新的模型名字都可以被准确识别出来。



入手前也可以先在网页上试试funasr的离线文件转写和实时听写效果

funasr.com/#/

这周我线下也跟不少人从这张AI录音卡片聊起,聊到我们都很期待的AI硬件。

它未来的形态,除了卡片,可能是手錶,是首饰、是耳机、是眼镜、甚至是发带。

这些散落在我们生活不同角落的智能终端,它们的共同点会是什么?

在聊了很多之后,我得到一个比较清晰的共识:

互补

它不应该试图取代手机,它应该成为手机的完美补集,去完成那些手机做不到、或者做不好的事。

手机就像是一个功能强大的瑞士军刀。但它的形态,一块需要用视觉和指尖去精细操作的玻璃,也决定了它的能力边界。它无法做到真正的全时无感,你总得先把它掏出来,解锁,找到App,然后再开始操作。

而这,就给DingTalk A1这类AI硬件们留下了不少操作空间。

或许是无数互补的、专注的AI硬件,一点点接管手机不擅长的领域,最终编织出一张将物理世界与数位世界无缝衔接的智能网路。

它们各自拥有独特的、无法被替代的专长,

在最合适的场景里,

以最优雅、最高效的方式,

完成自己的使命。

@ 作者 / 卡尔
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|花享网 ( 琼ICP备2024046163号-1 )

GMT+8, 2025-9-8 07:09 , Processed in 0.247398 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表