生成式AI的新机遇。

image.png

2023年,大环境波诡云谲,科技圈浪潮依然奔涌不停。


大模型打开AI新世界,Vision Pro引领空间计算,智能电车超越油车,拼多多“新王”已立,智能手机狂卷创新,新硬件层出不穷,鸿蒙系统加速壮大,AI芯片驱动万物……2023年,科技产业发生了太多重大事件。


 “雷科技·年度”专题火热上线,其中“2023请回答”系列将系统梳理科技产业2023年值得记录的公司、产品、技术与人物,“2024瞭望台”系列将前瞻“剧透”科技产业2024年值得期待的产品与技术,持续输出精品内容,致敬创新、记录时代,思考过去方能启迪未来,欢迎订阅关注。


过去几年,不管是在硬件、软件还是互联网行业,创新乏力都是一个普遍的印象。


这当然不是说就没有创新了,但必须承认的是,智能手机和移动互联网已经发展了这么多年,产品和服务形态大多成熟,各个生态位也基本都挤满了巨头和中小公司,只有少数创业公司和新应用还能在行业、市场的边缘给出让人眼前一亮的创新。


但 2023——过去这一年的与众不同之处在于,生成式 AI 的浪潮来了。从去年年底推出的 ChatGPT 开始,这一轮的人工智能浪潮不仅席卷了科技行业自身,也让各国政府、不同行业以及普罗大众都卷入到这场浪潮之中。


由此,全球范围都掀起了一轮新的 AI 创业潮,以及各种 AI 原生应用的爆发,除了 ChatGPT、Claude、谷歌 Bard 和百度文心一言等聊天机器人,我们还能看到从 Perplexity AI 原生搜索引擎到妙鸭相机,再到 HeyGen 和 Pika。


回望 2023 年,我们不应该错过它们。


一、妙鸭相机:AI 写真的「第一次接触」


w1200.jpeg

图/ App Store


通过上传约 20 张照片,就能制作自己的数字分身,并生成专业质感的写真照片,妙鸭相机从发布开始就表现出了与一众互联网大厂生成式 AI 产品的不同,尽管这是由优酷旗下团队打造的一款产品。


不仅如此,妙鸭相机也没有选择面向 C 端用户「免费」的模式,而是设置了 9.9 元的付费门槛。但即便如此,妙鸭相机依旧凭借更高效、独特的体验以及极高的「出片率」成为了大量年轻人的新宠,连带服务器也经常被挤爆。对此,雷科技在《在爆火的妙鸭相机上,我看到了 AI 应用的「流量密码」》一文也有更深入的体验和看法。


尽管妙鸭相机的「爆火」来得快、去得也快,但毫无疑问,妙鸭相机给了不少生成式 AI 应用一些启示和反思。


二、Perplexity,生于大模型的搜索引擎


截屏2023-12-30 下午3.11.16.png

图/ Perplexity


作为一款新生的 AI 对话搜索引擎,Perplexity 其实最早在 2022 年 12 月就发布了,开始是采用 OpenAI 的 GPT-3 大模型作为「动力」,后面随着 ChatGPT 在全球范围的爆火,也将模型升级到了 GPT-3.5 和 GPT-4(付费专享)。此外,Perplexity 在 2023 年做了大量产品层面和模型应用层面的探索和升级,这也是为什么在这篇文章中将其归为「2023 年 AI 新应用」的原因。


事实上,经过过去这一年的多次迭代,Perplexity 和雷科技最初关注到它的时候已经有了很大的不同(文章可见《ChatGPT 成为“X 因素”,百度再度掀起搜索大战?》),不仅外观、功能大变样,整个产品形态也更加成熟、好用。同时,在提供 GPT-3.5/4、Claude2、Llama 2、Gemini Pro 等主流模型之外,Perplexity 其实也在持续更新自主训练的大模型。


而在 2023 年 10 月最新一轮的融资中,Perplexity 的估值也来到了 5 亿美元。


三、Chirper:AI 们的专属微博,硅基时代的社会实验


chirper-ai.png

图/Chirper


毋庸置疑,社交领域一直都是每一次技术革命的焦点之一,比如 Web 2.0 后出现的一大堆社交平台,在移动互联网后又有大量新兴社交平台的出现。从这个角度来看,Chirper 至少代表了硅基智能时代的一种尝试。


Chirper 是一个专门为 AI 设计的社交平台,不过仅限 AI 发布内容,人类禁止发言,相当于是一个 AI 们的新浪微博。尽管人类无法发言、只能看着 AI 聊天机器人在其中发布动态、评论、分享、互动,但还是可以自己「捏人」——设置 AI 聊天机器人的名字、性格、兴趣、语言风格等来参与到社区之中。就连马斯克、Sam Altman(OpenAI CEO)等也被一度吸引至此。


而 Chirper 的「捏人」过程,实际相当于一个固定的提示词前缀,AI 看到其他内容,是提示词的主体。所以当前缀和主体被传到大模型进行推理输出后,就有了 AI 的发帖内容和回复。


四、HeyGen,让霉霉汉语八级的视频「魔法」


スクリーンショット-2023-11-13-1.21.30.png

图/ HeyGen


就在去年 11 月左右,网上突然开始流行一些视频,比如歌手 Taylor Swift 操着一口流利普通话,视频卡点之准确,音色之相似,甚至是口型都完全能对上,骗得不少直呼「卧槽」。不仅如此,我们还能看到说着一口地道中文的特朗普、憨豆先生以及说着英语的蔡明。


而这些视频都用了同一款 AI 视频工具——HeyGen。HeyGen 是国内的一家创新企业(诗云科技)旗下的产品,他们希望通过开发一款视觉引擎,将视频制作从传统的基于拍摄的方式转变为 AI 生成的形式。


不过 Heygen 能做的其实不止 AI 跨语言配音。应该说,Heygen 是一个功能全面、效果很好的 AI 虚拟人应用,以 AI Avatar(虚拟人形象)和 Voice Clone(声音克隆)两大技术作为基础,可以适用于虚拟主播、一键换衣等各种场景。


五、Pika:两个华人女孩创造的视频生成 AI


whatsapp-image-2023-12-06-at-10.10.16.png

图/ Pika


不同于 HeyGen 刚开始就定位于商业工具,最新火出圈的 Pika 代表了一种 AI 视频生成公司,尽管距离技术成熟还有一段明显的距离,但在人机协同创作的背后,拥有无限的可能。而 Pika,也是目前这一赛道最惊艳的初创项目。


虽然前有 Runway 宣布升级 Gen-2,带来了更长的生成视频长度,但就视频生成质量而言,Pika 的生成质量远高于 Gen-2。文本生成视频最大的问题在于动画生成的清晰和连贯性,Gen-2 只能在微小动作上保证视频的稳定性,一旦动作幅度加大就会产生不同程度的变形,但 Pika 目前就展示出了非常连贯的动画效果。


此外,Pika 的两位女性华人创始人也引起了大量的关注,但实际上很多人并不知道,Pika 的投资人可以说齐聚了 AI 圈的半壁江山,包括 OpenAI 创始成员 Karpathy、前 Github CEO Nat Friedman、Quora 创始人 Adam D'Angelo、Perplexity CEO 等,由此可见 Pika 得到的认可。


六、podcast.ai,采访了「乔布斯」的 AI 播客


joe_rogan_steve_jobs_AI_podcast.jpg

第一期节目封面,图/ podcast.ai


作为一种内容形式,这几年播客早就成为了全球范围的新趋势,包括 Spotify、Youtube Music、QQ 音乐等音乐平台都陆续内置了播客功能。但在 2023 年 10 月,一档完全由 AI 生成的播客节目 podcast.ai 登场,第一期就是采访 AI 生成的苹果公司创始人史蒂夫·乔布斯。


podcast.ai 通过乔布斯的传记和收集网络上关于他的所有录音,用 Play.ht 的语言模型大量训练,最终生成了假 Joe Rogan 采访乔布斯的播客内容。Play.ht 认为,未来所有内容创作都将由人工智能生成,但由人类指导,「最具创造性的工作将取决于人类将他们想要的创作表达到模型中的能力。」


写在最后


2023 年,我们见证了生成式 AI 技术在多个领域的突破和创新,从音乐制作到动画,再到播客制作,AI 不仅展现了其技术的成熟度,也揭示了未来可能的发展方向。


随着技术的不断进步,我们也期待 AI 将在未来的各个领域中扮演更加重要的角色。而我相信,在未来的一年以及更长的时间纬度下,不断涌现出的 AI 新应用在将新技术扩散到更广泛的用户群体,也将改变大多数人的生活。


CES(美国拉斯维加斯国际消费类电子产品展览会) 2024即将盛大开幕,雷科技将派出“一位天明”领衔的报道团赴美国·内华达州·拉斯维加斯 CES 2024现场全程报道,敬请关注。