为何大家都在抢注这条赛道?
从去年雷军牵来一条“狗(CyberDog,艺名“铁蛋”)”,到今年领来一个“人(CyberOne,艺名“铁大”)”;从去年马斯克发布“特斯拉机器人”(Tesla Bot)新概念,到今年9月30日将推出人形机器人Optimus(擎天柱)原型机,仿生机器人作为互联网风口的明珠,成功出圈。

仿生机器人作为模仿生物、从事生物特点工作的机器人,不仅可以用于危险搜救、医疗救援、科研教学等非日常场景上,还能解决老龄化的家庭服务困难等问题。在机器人仿生外形上,有兀鹰、金枪鱼、江豚、昆虫、麻雀等等形态层出不穷,目前比较常见的四足机器人如机器狗,广受欢迎。

近日,在2022世界机器人大会博览会期间,头戴定制金色虎头的130只宇树科技GO1四足机器人在展示区热情“舞动”,在展位上也是围满了观众。“作揖”“翻跟头”“上下台阶”等动作行云流水,一气呵成,让观众惊叹不已。

边看机器狗表演的观众,边和身边的儿子交流着,“以后,妈妈给你买一条这样的狗,怎么样,你就牵着它,出去溜……”一会儿,她又指向宣传视频,“看,带着它出门就感觉很拉风,还很放心。如果养一只这样的狗,不用再想着喂食,多方便。”



图片来源:DoNews拍摄

有相同感慨的不止一位,新奇也好,有用武之地也罢,这无疑是推动了机器人更快的进入日常生活。

目前互联网、智能汽车等领域一批科技企业都在向机器人赛道奔赴,纷纷加大技术研发力度,积极整合产业资源,加快创新产品的推出;减速器、伺服电机等核心零部件企业成功进入国际头部企业供应链体系。从股价上来看,近段时间机器人概念股持续走强,且已持续数月处于上涨趋势。



数据来自:万得机器人概念指数

01.机器人的“流量密码”?
从影片走到现实,近年来随着行业技术的持续进步和应用需求的挖掘,打破了传统作业边界,涌现出一批又一批独具特色的新产品。

从类型来看,机器人可以划分为工业机器人、服务机器人和特种机器三大类。基于机器人外型上的差异和性能上各自独有的优势,目前应用到了各行各业,并不断走向纵深。

其中,四足机器人最为流行,出镜率也很高。作为仿生机器人的典型代表,四足机器人与双足、轮式等其他移动式机器人相比,具有运动灵活、复杂环境适应性强等优势。同时由于研究具有高动态性、高适应性、高稳定性、高负载能力性,后期在落地应用时,场景也更为丰富。

提到“机器狗”,很多人会联想到较早深耕于机器人领域的波士顿动力。2005年,基于给士兵运输货物的需求,携手福斯特-米勒公司、喷气推进实验室,以及哈佛大学康德菲尔德研究站共同研发的动力平衡四足机器人——“大狗”(BigDog),它可以踉踉跄跄地在不同地形上行走,驮154公斤重物,还能爬上35度斜坡。

可能大家最为熟悉的是Spot系列,2017年SpotMini一改往年的工业风,“身穿”黄色的新衣服,去年9月15号,Spot迎来3.0版本升级,加强了数据收集和处理能力。

回看我国国内市场,对于四足机器人研发和应用场景不断开拓。如去年,小米发布的首款仿生四足机器人CyberDog(铁蛋),小鹏汽车生态企业鹏行智能发布的全球首款可骑乘智能机器马;今年,腾讯在首个四足机器人“Max”基础上,提升算法和视觉能力,推出Max 2.0。还有宇树科技、优必选等创业公司。

除四足机器人外,工业和信息化部党组成员、副部长辛国斌表示:“机器人加快从‘拟人’向‘类人’进化。”

正如,达闼科技在东方卫视春晚和央视戏曲春晚中亮相的5G云端机器人Cloud Ginger“小姜”,以及雷军赶超马斯克率先发布的CyberOne。在最近举办的2022机器人世界大会上,也亮相了一些仿真人形机器人,他们被制作成邓丽君、爱因斯坦样貌,模仿其动作神态,吸引了大量的观众驻足。





图片来源:DoNews拍摄

但不得不说的是,目前人形机器人在动作上表现的并不丝滑,很难让人自然享受它所提供的服务。同时,正如日本机器人专家森政弘提出的“恐怖谷理论”:当机器人与人类达到一定的相似程度,这时候,机器人反而会给人僵硬恐怖的感觉。

相比之下,同在风口下的机器狗和人形机器人,前者会更易被大众所接受。

02.谁为仿生机器人买单?
据国际机器人联合会统计数据显示,2021年全球工业机器人安装量创下历史新高,达到48.7万台,服务机器人和特种机器人发展也保持强劲势头。机器人产业正在迎来一个创新发展、升级换代的重要机遇期。面对未来市场前景的预测,相关数据显示,2022年全球机器人市场规模将超3500亿元,预计到2030年,该数字将增长至1.7万亿元。

辛国斌称:“机器人的研发、制造、应用越来越成为衡量一个国家科技创新和高端制造业水平的重要标志。”面对市场的红利,仿生机器人是肯定要做,但如何做、如何做好却成为关键。

马斯克和雷军曾公开表示看好人形机器人的发展空间,其底气是自家技术给予的。去年马斯克在微博上发文称,“我们已经制造了带轮子的机器人(特斯拉汽车),所以现在我们几乎拥有所有制造人形机器人所需的零件。”。今年雷军带来的“铁大”,无疑是有去年研发机器狗“铁蛋”的经验加持。

在今年1月份,马斯克在财报电话会上曾表示,开发擎天柱是特斯拉今年最重要的工作,未来它将比特斯拉的汽车业务更重要、更值钱。但落地到应用场景中,谁又愿意为“人形机器人”买单呢?

对于将于9月30日正式亮相的擎天柱而言,马斯克表示,它既可以用于工业生产,也可以服务千家万户。马斯克还称,机器人擎天柱的价值将超过电动车和全自动驾驶业务,未来一台家用机器人可能比一辆汽车更便宜。据悉,擎天柱将在2023年量产。

而“铁大”作为业内第一款真正意义上的全尺寸人形仿生机器人,看点十足。它身高177cm,体重52kg,可对真实世界三维虛拟重建(自研Mi-Sense深度视觉模组,结合AI算法,提供完整的三维空间感知能力,看得到也看得懂),“小脑”发达、可实现双足运动姿态平衡,四肢强健、动力峰值扭矩300Nm等。尽管有黑科技傍身,但迫于高达六、七十万元的成本,尚不能实现量产。

不能商业化的“铁大”,不如说是一个集合各种技术的整合体。

相比大块头的人形机器人,机器狗显得小巧很多。

重量约15kg的铁蛋,销售数量也极为有限,其工程探索版的购入价格为9999元。若从销售量上来看,要说国内机器狗出货量最大的公司,宇树科技当仁不让。宇树科技拉通了小狗、中狗、大狗,把全产品线机器狗的尺寸和生态都全部做出,2021年面向2B和2C共销售1万余台,C端产品价格为1.6万元。

宇树科技创始合伙人陈立对DoNews表示,“相比于玩具或者是无人机,机器狗成本还是偏高。原因在于,机器狗有12关节模组,里面有编码器等,是一个比较复杂机电一体化产品,再加上AI,所以它的成本不会降到百元级别。但我们非常有信心可以把机器狗的价格做到千元级别。其实它作为一个娱乐酷玩、电子宠物,就可以进入千家万户。”

此外,结合国内外做机器狗的现状,陈立进行了对比,“国外,波士顿动力是一家非常优秀的公司,他定位于高质、高档,专注于行业落地。但在生产制造过程中选用的都是最好的零部件,这也导致成本偏高,进行商业化时比较困难。国内以小米、腾讯为代表的互联网大厂,目前他们更多是做一些技术储备,还未往产业化方向去做。”

“现阶段机器狗其实已经发展到了一个要爆发,但还没有爆发状态。”

在陈立看来,无论是宇树科技还是相关友商,现阶段机器狗的硬件已经发展到可通过技术迭代,做好可靠性、性价比和一致性。接下来厂商在继续做硬件的同时,要更多关注软件层面和不断迭代控制算法、感知算法,让机器狗在正常行走中更好的越障或者避障各种地形,让机器狗价格更低、更亲民。

03.中国机器人产业发展迈上新台阶

近年来,经产学研用各界共同努力,中国机器人产业发展迈上了新台阶,中国也已成为全球机器人最大应用市场。

据国家统计局数据显示,2021年中国工业机器人产量36.6万台,比上年增长68%,服务机器人产量921.4万台,比上年增长49%,特种机器人市场规模也在稳步增长。资本与产业也形成了联动发展,据统计2022年上半年中国机器人行业已披露融资金额超过50亿元。市场主体逐渐优化壮大,截止2021年底,机器人领域专精特新小巨人企业数量达到了101家,涵盖了整机核心零部件和系统集成等各类企业。

但在机器人创业创新发展的同时,“机器人是否会替代人”“伦理”等问题也是备受争议的话题,清华大学自动化系研究员赵明国教授对DoNews进行了解答。

在机器人是否会替代人问题上,赵明国表示,任何一个新事物出现都会产生这一问题,如“汽车出来会不会代替马车”。他认为,马车行业虽随着科技推进逐渐消退,但其从业者会自动转到其他行业中,同时汽车的出现也会产生新的就业机会。社会向前发展是必然,因此不需要担心这个事情。

在伦理上,随着社会的发展,产业界或者是社会都会逐渐把这个问题提出来,在应用上也会从道德角度、法律角度进行规范完善。

“我觉得机器人发展没有那么快,也不涉及到特别严重的伦理问题,因为传统来讲,我们先把机器人当作一个工具,一个替换生产力或者替换智力的工具,不太有可能存在太多的理论。”赵明国说道。

同时,赵明国指出,机器人产业还面临着人才短缺问题,短缺并不意味着培养的人才少,而是市场的需要和培养的侧重不一定匹配。过去是跟随性培养,如今要解决很多新问题,需要一些创新性的人才。因此,他建议道,高校在教育学生时应以创造性思维培养,为该领域储备人才。

立足当下,机器人正以燎原之势迅速发展。据世界机器人大会发布的《中国机器人产业发展报告(2022)》显示,预计2022年,中国机器人市场规模达到174亿美元,五年年均增长率达到22%。这也预示着,随着制造业工艺、人工智能、云计算、5G等技术的快速应用发展,机器人产业将开启蓝海市场。

展望未来,白花齐放春满园。在快速进入数字化、智能化时代的当下,“走出去”“引进来”才能实现产业高质量发展。

本文来自微信公众号“DoNews”(ID:ilovedonews),作者:田小梦,编辑:杨博丞,36氪经授权发布。










AI凭什么当互联网警察:父亲拍下孩子病灶,被判儿童色情

大公司不想担责,于是把责任推给AI。
谷歌搞了个大麻烦。

2021 年 2 月,美国人马克在医生的授意下,用自己的安卓手机,给儿子肿胀疼痛的生殖器拍了几张照片,发给护士,让对方判断病情。之后的诊断和治疗进展顺利,马克的儿子很快没事了。

但麻烦找上马克。那些照片,在同步上传到谷歌相册后,被谷歌的 AI 工具标记为“儿童性侵内容”。很快儿童保护组织介入,开始对事件进行调查,进一步确认了这些照片涉嫌“儿童色情”。

案件被报送给当地警方。一周后,警察敲开了马克的家门。同时谷歌彻底封禁了马克的账户。

犯错的 AI
引发此次乌龙的“罪魁祸首”,是谷歌的图像识别 AI。

利用 AI 来预防、打击儿童犯罪,并不是什么新鲜事。早在 2009 年,微软就曾开发过一个名为 PhotoDNA 的工具,来帮助追溯、阻断儿童色情内容的传播。

PhotoDNA 的核心原理,是一种名为“鲁棒哈希”(robust hashing)的技术。一般情况下,任何一个计算机文件,经过哈希算法,都只会得出一个唯一的“哈希值”,常被形容为“数据的指纹”。但 PhotoDNA 所采用的算法,可以得到一个更宽泛的哈希结果。



鲁棒哈希用于照片的简单原理丨图片来源 TechCrunch

具体到应用层面,PhotoDNA 可以根据已有的一张儿童色情图片,算出一个宽泛的哈希结果。之后,即便这张图片被裁切、编辑,依然会保留原图的一部分特征,对应的哈希结果也能与原图进行匹配。用一个直观一点的类比,就像只通过“半个”指纹的特征,就匹配到原指纹,进而追溯到主人。借此方式,科技公司就可以追溯、阻断此类内容的传播。

在 PhotoDNA 的基础上,谷歌的 AI 工具更进一步,它将已知的儿童性侵内容作为样本,进行了深度学习,不仅能通过“哈希计算”,识别已知的儿童色情内容,还能挖掘出泛化的特征,比如裸露、特定的器官、姿势。谷歌的 AI 能直接识别一切“涉嫌儿童色情、虐待的图像”,即便这个图像是第一次被上传到网络。

2018 年,谷歌推出了这个 AI 工具,还把它提供给了 Facebook 等一系列公司。这项技术被视为一次重大突破,成为打击儿童性犯罪的利器。

美国对儿童性犯罪的打击非常严厉,相关联邦法律规定,公民实体有义务检举儿童性犯罪的相关线索。所以,在谷歌的算法推出之后,公司内部立刻建立起一套“报送机制”,将检测到内容的相关线索,报送到儿童保护机构。

儿童保护机构的工作也因此取得了突破。在此之前,儿童犯罪的线索,大部分依赖“电话举报”,因为儿童犯罪常常发生在私人场所、家庭内部,想要开展调查、取证都非常困难,打击起来也常常会力不从心。

但有了相关的 AI 工具之后,从调查到取证,难度被大大降低。根据美国国家失踪于受虐儿童援助中心的数据,仅在 2021 年,靠着 AI 识别报送的线索,就找到了 4260 名潜在的儿童受害者。

不过,再先进的 AI 也会犯错。无论是技术层面的 bug,还是事实层面的误判。

针对这类“鲁棒哈希算法”,不少技术人员都在尝试“逆向攻破”它们的死角。比如通过逆向算法,生成一张与原图类似,但又有本质不同的图片,输入后会被 AI 识别为与原图的“哈希结果”一致,这就是“AI 的 bug”。



MIT 的一位技术人员提出名为 Ribosome(核糖体)的逆向方法,将PhotoDNA 看作一个黑盒,用机器学习的方法攻击哈希算法丨图片来源网络

更容易出现的问题,是事实层面的误判。马克事件里,AI 的识别并没有错误(马克拍的照片确实是他用手接触儿子生殖器的特写),但因为不了解事件背景,导致了乌龙发生。

不少观点认为,即便存在偶然的乌龙,也不能否定 AI 工具对打击儿童犯罪的积极意义。但科技公司、儿童保护组织、执法机构,也需要建立一个更灵活的系统,帮助马克这样的无辜者。

如何纠错?
马克很快洗脱了嫌疑。因为案子并不复杂,他向警探提供了当晚和医院医生、护士沟通的记录,证明了“照片是为了孩子求医”之后,警方很快就撤销了调查。

当马克提交相关信息,希望恢复自己的谷歌账号时,却遭到了拒绝。AI 把照片标记为“儿童色情”后,谷歌对账号展开进一步的调查,过程中发现另一段,马克的儿子和妻子,全裸躺在床上的视频。也被判断为“存在儿童侵犯的嫌疑。”



打击儿童虐待和贩卖丨图片来源 NCMEC

对于类似家庭隐私内容,几乎所有人无法接受它们被放置在某个人工审核员的屏幕上,接受审视。人工审核效率低、成本高,还涉及复杂的隐私问题,科技公司宁愿将“审核”交给AI。

很多科技公司在用人,还是AI上“进退两难”。

2019 年,《卫报》就曾报道,苹果在 Siri 的“改进计划”里,雇佣第三方公司的数据标记员,去听用户语音指令的“原声”。这项工作原本是针对 Siri 无法识别语音指令的情况,让真人去听过之后,补充、修正语音识别数据库的“样本”。但在这些“指令原声”中,包含了很多误触发 Siri 之后的用户录音,涉及大量隐私信息,比如商业交易、医疗沟通,甚至是犯罪和性行为。事件爆出后,苹果很快叫停了相关项目。

去年秋天,苹果也准备为 iCloud 照片系统部署一个与 PhotoDNA 类似的“哈希检测算法”。但因为隐私团体的反对,计划被无限期搁置。

马克的乌龙,任何一个“人”听了,都不难理解他是无辜的,所以警方很快就还了他清白。但对科技公司来说,很多时候,让“人”去介入这些事情,不仅高成本低效率,还牵扯道德、隐私和伦理。

在复杂的现实世界里,人需要 AI 的帮助,AI 也需要人的纠错。但两者到底如何合作,依然是一道难题。

互相负责
账号被封对于马克来说就是灾难。

他曾是忠实的谷歌全家桶用户,被封后,邮箱、Google Fi 手机号都不能用了,几乎与外界“断连”,多年以来的邮件、相册、日历数据也全都无法取回。

马克曾想过到法院起诉谷歌,但在咨询律师之后,他发现相关的起诉费、律师费需要约 7000 美元,还不能保证胜诉。考虑之后,他放弃了这个计划。

马克的遭遇并非个例。《纽约时报》报道马克遭遇的同时,还发现了另一名“受害者”卡西奥,他的遭遇和马克近乎一致,也是因为拍摄儿子的私密部位,发给家庭医生咨询病情,账号遭到封禁。

每年数十万的相关报告中,可能存在几百上千个类似的“误伤”。AI 可以识别出儿童的私密部位,但很难识别出这到底是“性侵的前奏”还是“父母帮孩子洗澡”。



谷歌判定不了父母对儿童“该做”什么丨图片来源 unsplash

比起恢复一个账号,谷歌更难做的是从“公共道德”角度重新审视这些内容。因此,它直接把问题丢给 AI,AI 采取对于儿童裸露“零容忍”的政策。直到这次事件被媒体报道,谷歌仍坚持自己的做法:不会给报道中涉及的两名无辜父亲解封。

无论是学界还是技术界,在评价这一事件时,人们几乎无一例外地肯定了 AI 工具在打击儿童犯罪方面起到的作用,同时也都认为 AI 需要一套纠错机制。

这个问题绝非无解,事情的关键依然在于各方(尤其大公司)如何主动负起责任,而不是过度依赖技术工具。

人和 AI,最终需要互相负责。

本文来自微信公众号 “果壳”(ID:Guokr42),作者:Jesse,编辑:沈知涵,36氪经授权发布。



机器人时代真来了?