果粉控注意到,ReALM 的特别之处在于,它可以同时理解用户屏幕上的内容和正在进行的操作。论文将信息分为以下三种类型:
屏幕实体:指的是当前显示在用户屏幕上的内容。
对话实体:指的是与对话相关的内容。例如,用户说“打电话给妈妈”,那么妈妈的联系人信息就是对话实体。
背景实体:指的是与用户当下操作或屏幕显示内容可能并不直接相关的实体,比如正在播放的音乐或即将响起的闹铃。
如果能够完美运行,ReALM 将使 Siri 变得更加智能和实用。他们将 ReALM 与 OpenAI 的 GPT-3.5 和 GPT-4.0 进行了性能对比:
“我们同时测试了 OpenAI 提供的 GPT-3.5 和 GPT-4.0 模型,并为它们提供了上下文信息,让它们预测一系列可能的实体。GPT-3.5 只接受文本输入,因此我们只提供了文字提示。而 GPT-4 能够理解图像信息,因此我们为它提供了屏幕截图,这显著提升了它的屏幕实体识别性能。”
那么苹果的 ReALM 表现如何呢?
“我们的模型在识别不同类型实体方面均取得了显著进步,即使是最小的模型,在屏幕实体识别上的准确率也比原有系统提升了 5% 以上。与 GPT-3.5 和 GPT-4.0 的对比中,我们最小的模型与 GPT-4.0 的性能相当,而更大的模型则明显优于它。”
论文的结论之一是,ReALM 即使拥有比 GPT-4 少得多的参数,也能在性能上与之匹敌,并且在处理特定领域的用户指令时表现更加出色,这使得 ReALM 成为一种可以在设备端运行的、实用高效的实体识别系统。
对于苹果而言,如何在不影响性能的情况下将这项技术应用于设备似乎是关键所在,随着 WWDC 2024 开发者大会即将于 6 月 10 日召开,外界普遍期待苹果将在 iOS 18 等新系统中展示更多的人工智能技术成果。
苹果2025年AI战略曝光:重建Siri核心技术
苹果人工智能战略泄露:重构Siri底层基础,改进现有AI模型
苹果新 Siri 超级碗知识测试大翻车,准确率仅 34%
古尔曼称苹果 2025 年 3/4 月发布青春版妙控键盘,提升 iPad Air 生产力
抖音SEO优化实战指南:如何精准布局,提升内容曝光与转化?
小米15 Ultra或将支持eSIM:面向海外市场 节省设备内部空间
vivo X200S或首发!天玑9400+参数细节曝光:超大核主频提升至3.7GHz
iQOO Z10 Turbo将搭载7K+大电池:全系主打超大电池的中端性能机
苹果预告 tvOS 18.2.1 更新:修复 BUG、提升稳定性
苹果迎头赶上:iPhone 17系列将搭载VC均热板,提升散热性能
湘ICP备19005331号-4copyright?2018-2025
guofenkong.com 版权所有
果粉控是专业苹果设备信息查询平台
提供最新的IOS系统固件下载
相关APP应用及游戏下载,绿色无毒,下载速度快。
联系邮箱:guofenkong@163.com