微软发布 Copilot Vision:你的 AI 浏览伴侣

微软发布 Copilot Vision,一款集成在 Edge 浏览器中的 AI 助手,能理解网页上下文,与用户实时互动,提供浏览辅助。

原文标题:微软「AI伴侣」Copilot Vision,让你用嘴浏览网页,还能和你一起打游戏

原文作者:机器之心

冷月清谈:

微软最新发布的 Copilot Vision 是一款集成在 Edge 浏览器中的 AI 助手,它能够理解用户浏览网页的上下文,并与用户进行实时互动,提供浏览辅助。Copilot Vision 可以读取网页文本、查看图片,并根据用户需求提供信息,例如旅行规划、购物建议、游戏指导等。该功能目前仅对部分 Pro 版用户开放,用户需授权后才能使用,且数据会在会话结束后删除。Copilot Vision 由三个核心组件构成:具备网络知识的底层 LLM、实时网页文本读取功能以及图像识别能力。微软 AI CEO Mustafa Suleyman 认为,AI 伴侣将成为未来智能生活的重要组成部分,能够理解用户的情绪、日程、兴趣等,并进行推理,最终成为类似于家庭成员或第二大脑的存在。

怜星夜思:

1、Copilot Vision 的出现会如何改变我们获取信息的方式?
2、Copilot Vision 强调隐私安全,它真的能做到保护用户隐私吗?
3、AI 伴侣的概念很吸引人,但它会带来哪些潜在的社会影响?

原文内容

机器之心报道

机器之心编辑部


昨天,就在 OpenAI 12 天连发的第一天发布火遍全网的同时,微软也发布了一款重量级 AI 产品:Copilot Vision。这是一款集成在 Edge 浏览器中的 AI 助手,可以与你实时「协作上网,并能随时提供帮助。


微软 AI CEO Mustafa Suleyman 的推文。

据微软博客介绍:「Copilot 现在可以理解您在线活动的全部上下文。当您选择启用 Copilot Vision 时,它会查看您正在浏览的页面,并与您一起阅读,然后你们可以一起讨论遇到的问题。浏览不必再是一种只有您和所有标签页的孤独体验。」

需要注意,目前 Copilot Vision 仅有数量有限的 Pro 版订阅者可以抢先使用。

Copilot Vision 发布后,虽然没能得到 OpenAI ο1 正式版那样的关注,但也有些 Copilot Labs 的 Pro 用户进行了尝试。


Copilot Vision 发布后不久,微软 AI CEO Mustafa Suleyman 还接受了著名 AI Newsletter「The Rundown AI」运营者 Rowan Cheung 的专访,他在其中介绍了 Copilot Vision 的基本功能和工作方式以及其它很多话题。他在介绍 Copilot Vision 时使用了「AI 伴侣(AI companion)」这个词。

详细采访请访问:https://x.com/rowancheung/status/1864716671317086384

AI 伴侣正是他们想要达成的目标。Suleyman 指出:「在我看来,AI 伴侣能听你所听,见你所见,本质上就是陪同你一起生活。你的 AI 伴侣有能力记忆你说过的一切,理解你浏览的网页内容,还能够像人一样与你交谈。」

值得一提的是,Copilot Vision 是一项完全可选的体验,用户必须明确授予 Copilot Vision 权限才能读取 Microsoft Edge 浏览器中的网页。

例如,让它帮助你计划如何在博物馆度过有趣的一天,Copilot Vision 会在你参观之前指出你需要知道的所有信息。


或者 Vision 可以帮助你进行假日购物,指出页面上哪些产品符合自己的需求和偏好。

下面更详细地展示了一个旅行规划的演示:


Vision 甚至可以简化信息和学习。观看 Vision 帮助你学习如何玩新游戏,例如 Geoguessr。


至于 Copilot Vision 的工作方式,微软暂时并未详细说明,但 Suleyman 在接受采访时稍微透露了一些。Copilot Vision 包含三个组件:

  • 一是底层 LLM,它具备网络上的知识。
  • 第二,它能即时读取你正在浏览的网页上的所有文本,并且无需用户执行滚动等操作。
  • 第三,它能看到你能看到的所有图片,实现多模态理解。

Suleyman 还简单预测了十年后人们的智能生活。他指出,现在人们常用的计算机图形界面就是为不懂编程的人设计的,而十年之后,这些东西将被 AI 接替,因为 AI 助手或 AI 伴侣将有能力理解有关你的一切,不管是情绪状态还是日程安排,又或是兴趣爱好、个人知识图谱、人际关系。它们还能根据我们日常的所见所闻、所思所想进行推理。

AI 将「不仅仅是一个交互接口,而是一个新的连接面,将会有根本性的不同。」Suleyman 甚至将其比作是一个新的数字种族(new digital species),就像是人们的一个家庭成员或第二大脑。


隐私安全

微软也强调了对安全的重视,该公司称在构建 Copilot Vision 时,将用户的安全、控制和隐私作为首要任务。首先,Vision 完全是选择性加入的,因此用户可以决定何时启用或打开它,作为用户在网络上的第二双眼睛。

此外,一旦用户结束与 Vision 的会话,有关用户所说内容以及用户与 Copilot 共享的上下文的所有数据都将被删除。每次使用 Vision 时,用户的数据都会根据 Microsoft 隐私声明进行处理和保护。仅记录 Copilot 的响应以改进安全系统。

目前,Vision 仅能与一组选定的网站进行交互。随着时间的推移,微软会谨慎地扩大这个网站列表。微软承诺,Vision 不会捕获、存储或使用来自出版商的任何数据来训练模型。

对于这个被 OpenAI o1 光芒掩盖的产品发布,你有什么看法?

参考链接:
https://www.microsoft.com/en-us/microsoft-copilot/blog/2024/12/05/copilot-vision-now-in-preview-a-new-way-to-browse/
https://x.com/rowancheung/status/1864716671317086384?t=688

© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]

关于“Copilot Vision 强调隐私安全,它真的能做到保护用户隐私吗?”这个问题,我觉得微软既然强调了隐私安全,应该还是比较靠谱的。毕竟现在大家对隐私都很重视,他们也不敢乱来。不过,具体效果还是要等更多人用过之后才知道。

这就像一个悖论,AI 要想更懂你,就必须知道更多关于你的信息。所以,要绝对的隐私安全,可能就享受不到 AI 的全部便利。就看大家怎么权衡了。

从社会学角度来看,AI 伴侣的普及可能会加剧社会分层。拥有更先进 AI 伴侣的人群可能会在信息获取、资源利用等方面获得更大的优势,从而进一步拉大与其他人群的差距。

我觉得 Copilot Vision 可能会让信息获取更加便捷和高效。以前我们需要自己筛选和整理信息,现在有了 AI 助手,可以直接帮我们提取关键信息,还能根据我们的需求进行个性化推荐,省时省力。

改变当然是巨大的,以后估计“科普”博主都要失业了,哈哈。不过说真的,以后获取信息可能更加被动,就怕被 AI 牵着鼻子走,万一它给我推荐的都是我想看的,而不是我应该看的,那就麻烦了。

任何科技公司的数据安全承诺都值得商榷,尤其是在涉及到用户浏览历史这类敏感信息时。虽然 Copilot Vision 声称会删除会话数据,但数据的存储和处理过程中仍然存在风险。用户需要保持警惕,谨慎选择是否使用。

从学术角度来看,Copilot Vision 这类工具的出现代表着人机交互方式的进一步发展。它将用户从繁琐的搜索和筛选过程中解放出来,能够更专注于信息的理解和应用。不过,其潜在的信息茧房效应也值得关注。

AI 伴侣啊,听起来很美好,但仔细想想,有点吓人。如果 AI 太过了解我们,会不会反过来控制我们?就像电影里演的那样,细思极恐。