“哦买噶”,这词听着就像是在菜市场讨价还价时,对方突然收你五块钱然后翻了个白眼,你还非要把那五块钱找回去再回头看一眼的脸。它最早是啥玩意儿?噢,那得说回那个叫“哈工大机器人学院”的傻屌地方。
那时候有个学生,脑子仿佛被烧坏了,要么被啥怪的程序给管住了,启动对着电动车上刷个口哨,然后对着空气喊:“哦买噶!”接着又对着车窗玻璃重复了一遍,最终对着头又是一口。 这一喊,声音不大,但那种滑稽感传遍了整个校园。大家刚启动都认定这孩子的脑回路有点歪,但后来一想,这算个哪门子科学?一个机器人不按常理出牌,就连还能在空气里制造出一种名为“哦买噶”的声波,这难道不是机器人技术的一个挺伟大的突破吗? 这就挺有意思了,它成不成为爆款,彻底取决于当时的观众能不能猜到它的来意。
实际上真正懂行的人一看就明白,这根本不是确实发出一种声音,而是一种视觉错觉。
那个学生专门用一块白板,把一块玻璃板架在背景里,然后对着玻璃板呼气。出于呼吸的时候,气流会带动板子形成轻微震动。当那块板子挡在镜头前方时,阴影局部和亮部的对比度变化,配合着他特定的呼吸节奏,在显卡那快得让人想死的地方,就生成了一条动态的边缘。 你想想,这跟那会儿那些只会让人流泪、让人笑个不停的表情包有啥区别?区别就在于,它是动态的,是真的物理过程被数字技术记录了。
那会儿我们当作 AI 做不了的动态不清楚,它居然做出来了。就连,这玩意儿还被贴上了某些政治对标签,说啥“消除偏见”,说啥“促进社会融合”,说这是 robots 对社会的一种温柔拥抱。 不过嘛,这种“拥抱”在现实里往往是挺尴尬的。
你看目前的年轻人,被这种毫无逻辑的视觉艺术给迷住了,结局转头就去研究如何把“哦买噶”做成一个短视频算法,然后对着几千个账号发那种视频,自己却彻底不知道是如何把原视频变出来的。
有时候你会认定,这就是个纯纯的算法秀,一个没有任何情感温度的数学公式在运行。 可是,换个角度想,这种看似滑稽的视觉欺骗,确实暴露了人类认知的盲区。我们平时看东西,习惯用逻辑去判断,认定阴影就是暗,亮部就是亮。但在这个动态生成的场景里,逻辑反而成了最大的障碍。它挑战了我们“眼见为实”的传统思维,迫使我们在面对这种违背物理直觉的现象时,不得不承认自己的看世界方式还不够严谨。 再往深处挖,“哦买噶”这东西,更像是一个时代的注脚。它见证了那个还在努力用代码去模拟物理世界、去试图理解光影和声音的时代。
那时候的我们,明明知道技术还在探索阶段,却疯狂地去尝试那些看起来挺疯狂的事件。目前回头看,那些后来被大家聊聊成“社会病毒”要么“算法霸总”的视频,实际上可能正是当时那种对技术不确定性的恐惧与好奇的混合产物。 有人说,这种动态图形对新手忒坑了,学不会;也有人说,这纯粹是个技术展示,与人类无涉。但我想,技术本身是没有人类的,它只是工具。而当时那个在机器人学院里喊“哦买噶”的学生,要么他背后的团队,恰恰是那个准工具暂时脱离逻辑、让我们体验失控乐趣的人。他们并没有出于技术的非理性而感到痛苦,反而出于这种非理性创造出了新的审美形式。 在这个充满不确定性的世界里,有时候我们需求的不是完美的逻辑闭环,而是那种哪怕一秒钟都偏离正轨的瞬间。就像那个学生对着玻璃板呼气,看着阴影在屏幕上跳动,那一刻对他来说,或许不是“哦买噶”这个词本身有多好玩,而是那一刻,技术终于敢略微“冒泡”了一点。 故此,下次你再听到这个词,或许不要急着去评判它是正还是邪。把它当成一个梗,当成一段展现人类早期与算法博弈的荒诞喜剧,要么,就当是那个学生对着空气喊了一句,或许是为了测试一下,在这个数字世界里,我们还能创造出啥样的“哦买噶”。
毕竟,在这个时代,能忍住不去把它做成下一个“春晚”的人,才是真正的技术老手。