k8凯发(中国)天生赢家·一触即发

    实时解读|“xbox在线看视频”的深入报道

    xbox在线看视频

      来源 :微软深夜再掀AI生产力革命 ,奥特曼登台「自曝」新模型 !定制Copilot十亿打工人狂欢新智元

      AI生产力的革命 ,微软怎会缺席?

      在今天的开发者大会上 ,曾经誓要‘颠覆’10亿打工人的Copilot ,依然是全程的主角 。

      没想到70年后 ,还是要靠微软重新定义软件

      不仅有Copilot加持的全新AIPC ,日常生活助手Copilot ,还有为全世界开发者提供的AI工具堆栈 。

      更惊喜的是 ,SamAltman竟然在发布会的最后 ,被CTOKevinScott请上了台 !

      两人开场先是一波寒暄 ,然后共同感慨 ,这简直是疯狂的一周 ,疯狂的一年 !

      三大杀器

      过去的一年半里 ,世界发生了诸多变化 ,其中最令Altman本人震惊的事是什么?

      Altman表示 ,数百万开发者是推动过去一年里世界巨变的核心 。

      从GPT-4 ,再到GPT-4o的发布 ,尽管模型API推出时间不久 ,但我从未见过一项技术能如此迅速地得到有意义的应用 。

      人们正在构建我们从未想过的创新应用 ,完全展现了开放API的价值所在 。

      而KevinScott也调侃道 :看得出来 ,你们很好地利用了手里的超强超算 。

      2020年交付的‘鲨鱼’级超算训出了GPT-3 ,接下来的‘虎鲸’级超算训出GPT-4 ,而现在‘鲸鱼’级超算微软正交付给OpenAI

      奥特曼还表示 ,新的模态和整体智能将是OpenAI下一个模型的关键 。

      他预计模型将会变得更智能 、更强大 ,更安全 ,而且GPT-4o将会速度更快 ,成本更低 。

      是的 ,就像摩尔定律推动信息革命一样 ,ScalingLaw和模型架构一起 ,改变了我们使用数据 、生成数据的方式 。

      在这些缩放定律的影响下 ,我们拥有一个新的自然用户界面 ,这是一个模型 ,这意味着支持文本 、语音 、图像 、视频作为输入和输出 。

      MicrosoftCopilot ,是日常生活中的助手;Copilotstack ,则可以让我们构建AI程序 、解决方案等 。

      还有一个重头戏 ,当然就是昨天发布的全新Copilot+PC ,它直接打破了纪录 ,成为有史以来最快的AI电脑 !

      如今 ,Windows成为了构建AI应用的最佳平台 。而这种影响 ,不啻于Win32对图形用户界面的意义 。

      GitHubCopilot‘插件商店’首发

      继Copilot成为最流行的代码补全工具和‘个人助理’之后 ,微软本次又更新了这个效率提升神器 。

      微软表示 ,很多开发者在代码之外花费了75%的时间 ,比如追踪工作流 、以及撰写需求文档和规格说明等 。

      不仅如此 ,定位和修复bug的工作往往需要频繁进行上下文切换 ,开发者在数据库 、IDE 、代码仓库 、监控工具 、云平台之间疲于奔命 ,无法专注于代码本身 。

      这正是全新GitHubCopilot可以发挥作用的地方 。

      它可以通过对话的方式将所有流程整合在一起 ,帮你调用所有工具和平台 ,开发者只需要专注于IDE界面的核心代码内容 ,最大限度减少上下文切换 。

      不仅如此 ,基于强大的网络搜索和推理决策能力 ,Copilot还能回答关于开发过程的问题 。

      比如在下面这个demo中 ,用西班牙语描述需求 ,Copilot就可以自动编写出代码 ,并为Azure上的部署提供建议 。

      GitHub产品副总裁表示 :‘使用自然语言编程将继续降低软件开发的门槛 。未来 ,10亿人可以利用GitHubCopilot ,以自然语言的方式与开发技术栈中的任何工具集成 ,在GitHub上构建代码 。’

      GitHubCopilot支持各种各样的开发工具和平台 ,包括DataStax ,Docker ,MongoDB ,OctopusDeploy ,Pangea ,Pinecone ,ProductScience ,ReadMe ,Sentry ,Stripe以及微软自家的Office全家桶 、Azure和Teams 。

      GitHub产品高级副总裁MarioRodriguez表示 :‘我们的目标是使GitHubCopilot成为最集成 、最强大 、最智能的AI平台 。’

      在此基础上延伸出的CopilotWorkspace更是提高了开发团队使用GitHub管理项目代码的效率 。

      之前 ,用户只能通过GitBash命令行上传项目文件 ,图形化界面能进行的操作非常有限 。

      有了CopilotWorkspace ,各种时间线和代码分支一目了然 ,上传文件也容易很多 。

      而且还提供了非常清晰的代码变动可视化界面 ,让你自始至终都对项目有满满的掌控感 。

      截止目前 ,GitHubCopilot仍处于内测阶段 ,之后将在GitHub插件市场中发布 。

      不仅如此 ,对开发者来说 ,更酷的是——你可以定制自己的Copilot插件 !

      3种方式 ,定义自己的Copilot插件

      SharePoint是微软开发的用于组织内部存储 、管理和共享内容的平台 ,每天上传数量超过20亿条 。

      为了减少工作中搜索和筛选内容的时间 ,微软开发了从SharePoint创建Copilot的功能 。

      任何拥有SharePoint网站编辑权限的人 ,只需点击几下就可以自定义Copilot功能 ,还可以通过Teams聊天框 、电子邮件等方式将创建好的Copilot分享给团队中其他成员 。

      点选好SharePoint中允许访问的内容范围 ,以及Copilot的身份和行为等信息 ,它就可以立刻投入工作了 。

      比如内容回答问题 、总结信息或者查找文件 ,基于你之前授权给它的内容 ,Copilot可以提供最新 、最准确的响应 。

      想要在SharePoint之外创建自己的Copilot?

      没问题 !微软还发布了CopilotStudio ,提供更灵活的自定义功能 。

      在SharePoint之外 ,CopilotStudio支持超过1000个数据连接器 ,方便你将各种数据源导入Copilot 。

      CopilotStudio依旧采用类似SharePoint中‘对话驱动’的界面 ,你可以像聊天一样描述——想要Copilot有什么样的知识和功能 ,CopilotStudio就可以立即创建 ,并支持实时的测试 、修改和发布 。

      为了用户更容易上手使用 ,Studio中还内置了各种Copilot模板 ,比如用于组织清晰度的OrganizatiionNavigator 、用于员工健康管理的Wellness等 ,未来几个月还会有更多Copilot模板发布 。

      使用CopilotStudio ,你会有一种一切尽在掌握的感觉 。

      如果你是一个高端玩家 ,更喜欢用代码优先的方式构建插件 ,也可以使用VisualStudioCode和TeamsToolkit ,编写函数来精准定义Copilot的工作流 。

      Copilot新能力解锁

      Copilot早就不止步于代码补全功能 ,而是已经演变‘个人助理’ ,成为打工人们的效率提升神器 ,而且与多种工具和平台合作 ,构建起一套完整的‘Copilot生态’ 。

      本次Build大会上 ,微软又为Copilot解锁了一系列新功能 。

      TeamCopilot将功能延伸到‘个人助理’之外 ,开始成为团队的一员 。

      它能承担单独的职责 ,提升整个团队的工作效率 ,比如组织并记录会议 、跟踪讨论内容等 ,甚至可以充当项目经理 ,为成员分配任务并及时跟进ddl 。

      对于聊天界面中团队成员们的讨论进展 ,Copilot还能实时更新自己的记录内容 。

      可以在Microsoft自家开发的Teams 、Loop或者Planner等协作办公软件中使用TeamCopilot 。

      这项功能将在今年晚些时候以预览版形式向有Copilot许可证的用户发布 。

      如果Copilot仅仅进化到团队助手 ,你可能还是小看了微软 。

      就像用户可以自定义Copilot插件一样 ,你也可以使用CopilotStudio自定义一个CopilotAgent 。

      它不再像原来一样被动地等着你问问题或者分配任务 ,而是变成‘事件触发’的智能体 ,像虚拟员工一样工作并自动执行任务 。

      这意味着 ,CopilotAgent不仅需要记忆 、上下文推理以及根据反馈学习的能力 ,而且需要更加主动 ,能够在后台自发执行任务 。

      这样的Copilot岂不是会让一大批白领失业?

      微软业务应用程序和平台公司副总裁CharlesLamanna在采访中表示 ,它可以消除一些重复 、琐碎的工作 ,例如数据输入等 ,也许都是没有人真正想做的事情 。

      GPT-4o上新 ,多款基础模型可用

      除了Copilot华丽的演示之外 ,在开篇提到的三个平台中 ,最核心的是构建最完整的端到端堆栈——Copilotstack 。

      其中 ,最底层是基础设施 ,然后是基础模型层 。

      为了AI工作负载 ,微软特意构建了全新的数据中心 。

      因此 ,微软可以用每一兆瓦的功率 ,来降低AI的成本和功耗 。

      截止2024年5月 ,Azure超算能力已经实现了30倍的增长 !

      可以说 ,他们提供了世界上最先进的AI加速器 ,开发者可以拥有最完整的AI加速器选择 。

      从GPT-4到GPT-4o ,不仅模型的速度提高了6倍 ,成本更是便宜了12倍 。

      而这背后 ,是微软与英伟达 、

      英伟达关键平台产品 ,都会引入微软的云中 。

      而说到和AMD的合作 ,微软是第一个提供最新NDMI300Xv5虚拟机的云服务供应商 。

      无论对于AMD ,还是对于微软 ,这都是一个意义重大的里程碑 。

      自研AzureMaia100 ,只要你用过微软的服务 ,或多或少都会接触到 。

      而最新AzureCobalt也开始进行公开预览了 ,目前已经为MicrosoftTeams等服务提供了数十亿次对话的支持 。

      在基础模型方面 ,微软与OpenAI展开了深度合作 ,而现在GPT-4o可以在Azure上进行训练 。

      一张图 ,展示了GPT-4o依旧是最强的模型 。

      而在如此强大的模型的加持下 ,Copilot甚至已经‘进化’到指导我们怎么玩游戏了 !

      举个例子 ,你想弄清如何在《我的世界》中制作一把剑 ,却毫无头绪 。

      Copilot会从头教你 :为了造一把剑 ,你需要先收集材料 。按E键 ,就能打开自己的材料库了 。

      Copilot发现 ,我们缺少制作剑刃的材料 ,为此 ,需要收集木材 、石头 、铁 、金或者钻石 。

      忽然出现的小人 ,让玩家吓了一跳 。

      Copilot提示道 :这是一场僵尸赛跑 ,我们需要尽快摆脱它们 。要么快速建一座方块塔 ,或者快速找到一个避难场所 ,还可以挖到山的另一侧 。

      此外 ,微软首次介绍了十分强大的Agent能力 。

      想露营但找不到合适的鞋怎么办?给它看一眼你的鞋 ,就能让它给你提意见了 。

      Agent分析道 ,这款非常适合夏季远足 、让双脚保持凉爽 ,然而却不是这次的最佳选择 。

      既然如此 ,我们就让Agent直接挑一款最合适的 。

      Agent发现 ,这次最合适的产品是TrekReadyHawking ,它为脚踝提供了支撑 ,还能在寒冷的山区为脚部提供保暖 。然后 ,它还帮我们把这双鞋添加到购物车中 。

      当然 ,除了OpenAI的模型之外 ,微软Azure平台还将提供多款可用的模型 。

      并且 ,微软依旧拥抱开源社区 ,与HuggingFace合作 。

      最强小语言模型 :Phi-3

      除了引入外部模型之外 ,微软一直以来都在押注小模型 ,并引领了一场SLM革命 。

      从去年6月Phi-1面世 ,到Phi-1.5 、Phi-2 ,再到如今Phi-3 ,微软小模型已经完成四次迭代升级 。

      今天 ,Phi-3家族正式官宣新成员 :

      Phi-3-vision 、Phi-3-small ,Phi-3-medium 。

      其实 ,Phi-3-small ,Phi-3-medium对于每个人来说 ,或许并不陌生了 。

      上个月 ,微软首次亮相Phi-3-mini ,经过3.3万亿token训练仅有38亿参数 ,而且还可以部署在手机上 ,性能与Mixtral8x7B和GPT-3.5相媲美 。

      论文地址 :http ://arxiv.org/pdf/2404.14219

      另外 ,技术报告中 ,还首次展示了经过4.8Ttoken训练的7B模型Phi-3-small ,以及14B模型Phi-3-medium 。

      具体来说 ,Phi-3-small提供了8k和128k上下文 ,实力与Llama-3-8B-In 、Gemma7B ,以及Mistral7B相当 。

      而提供了4k和128k上下文的Phi-3-medium ,性能可以超越Mistral8x7B 。

      而现在 ,这些模型已经在HuggingFace上发布 ,开发者们可以下载权重并使用 。

      真正引人关注的是 ,Phi-3在今天正式推出了多模态模型Phi-3-vision ,有42亿参数 ,128k上下文 。

      它可以完成一般的视觉推理任务 ,比如现场演示中 ,询问图表中的信息 。

      甚至 ,人们还可以使用Phi-3-vision进行OCR 、表格理解 、一般图像理解等 。

      值得一提的是 ,这款轻量模型仅用了一天半的时间 ,在512块H100上完成了训练 。

      它使用了500B视觉和文本token ,其中‘教科书数据集’一直以来是Phi系列模型的训练核心 。

      这次 ,Phi-3-vision的训练的图像数据来自 ,精选高质量图文搭配的内容 ,还有

      其中包括 ,图表 、表格 、示意图 、幻灯片等教授的数学 、编码 、常识推理等 。

      尽管参数量级非常小 ,在多模态基准测试中 ,Phi-3-vision的性能超越了Claude3haiku 、LlaVa和Gemini1.0Pro 。

      甚至 ,各项性能非常接近GPT-4V 。

      一些开发者已经上手体验了 ,并称令人印象极为深刻 。

      还有一些开发者们也决定尝试一番 。

      以上Phi-3模型 ,不仅可以在云端运行 ,甚至可以在本地运行 。

      此外 ,纳德拉还在今天发布了Phi系列的SOTA模型——Phi-Silica 。

      微软称 ,这是一款专为Copilot+PC设计的33亿参数模型 ,每秒可以处理650token的 ,功率消耗约为1.5瓦 。

      这就意味着 ,Phi-Silica不会占用大量算力 ,并可以释放PC的CPU和GPU来处理其他计算 。

      另外 ,它的token生成会重用NPU的KV缓存 ,并在CPU上运行 ,大约每秒可输出27个token 。

      微软表示 ,‘Phi-Silica的不同之处在于 ,它是Windows首个本地部署的语言模型’ 。

      它针对Copilot+PCNPU进行了优化 ,可在本地设备上实现超快的推理响应速度 。

      这是Windows将先进的AI技术直接带给第三方开发者的一个里程碑时 ,为他们开发出色的Windows原生体验和第三方体验铺平了道路 。

      Phi-3模型最新的应用 ,便是微软还和可汗学院联合打造教育模型 。

      在模型的帮助下 ,学生们不仅得到了个性化的AI指导 ,老师们也感受到了自己的价值 。

      更重要的是 ,在Phi-3的加持下 ,能够免费提供给教育工作者的Khanmigo ,必将极大地改变美国的教育界 。

      Windows

      Copilot+PC将重新定义任何一个人在PC所做的一切 。

      PavanDavuluri展示了Copilot加持下的玩家 ,不用

      通过将Copilot集成到XBox中 ,可以大幅提升游戏体验 。

      此外 ,微软还与Quest联手 ,将Copilot带进VR世界 ,并为Quest带来可扩展到3D空间的Windows应用程序 。

      参考资料 :

      参考资料 :http ://build.microsoft.com/en-US/home#live-stream

      责任编辑 :王许宁

    联系我们