性能超越 Meta 和 Google 微软推全新 Phi 3.5模型
编译/庄闵棻
微软推出了一系列经过更新的小型语言模型,这些模型在多项基准测试中超越了Meta与Google等竞争对手产品,仅次於OpenAI的GPT-4o-mini,这些新模型已在Hugging Face平台上发布,并获得了开放的MIT许可,表现胜过Llama 3.1-8B-instruct、Gemma 2-9b-It和Gemini 1.5-Flash等对手。
Phi 3.5模型是对4月发布的Phi 3平台的升级版本。示意图。(图/取自微软官网)Phi 3.5新模型在基准测师中表现优异
据报导,这次发布的Phi 3.5模型是对4月发布的Phi 3平台的升级版本,包括Phi 3.5-MoE-instruct、Phi 3.5-mini-instruct和Phi 3.5-vision-instruct三种模型,根据微软的说法,这些模型在推理和多语言支援方面表现出色,特别是在BigBench、MMLU和ARC Challenge等基准测试中。
更多新闻:这5个痕迹 让你辨识 AI 生成图像
Phi 3.5-MoE-instruct模型的优势与限制
其中,Phi-3.5-MoE-instruct模型是基於Phi-3合成数据和经过筛选的公开文档训练而成,着重於高品质且推理密集的数据,该模型支援多语言,具备128K上下文长度,适用於商业和研究用途,微软表示,这款模型针对记忆体或计算受限环境、低延迟场景,及需要强推理能力(如程式设计、数学和逻辑)的应用而设计,其表现优於Llama 3.1-8B-instruct、Gemma 2-9b-It和Gemini 1.5-Flash,但它无法与OpenAI的GPT-4o-mini-2024-07-18的版本相提并论。
然而,微软也指出,Phi-3.5-MoE-instruct模型在某些任务中受到其大小的限制,无法储存过多的事实性知识,可能导致资讯不准确的情况,但该公司也补充说,只要透过在RAG(检索增强生成)设置下与搜寻引擎结合使用,就可以解决这一问题,在技术细节上,微软则是使用了512块辉达H100-80G GPU,历时23天,用4.9万亿个词元进行了训练。
Phi 3.5-mini-instruct模型:性能优异,适合多轮对话
此外,支援128K上下文长度的mini-instruct模型,也有优异表现,这款mini-instruct模型基於2024年6月Phi-3 Mini的指令调整版本进行改进,尽管其推理能力仍略逊於OpenAI最新的4o-mini聊天模型,但透过增加後续训练数据,也提升了多语言、多轮对话和推理能力,mini-instruct拥有38 亿个参数,是一个密集的解码transformer模型,使用与Phi-3 Mini 相同的标记器,在512 个辉达H100-80G GPU 上,经过10 …
使用 GPT-4o mini和GPT-4o 不可错过的实用技巧
编译/黄竣凯
自OpenAI於2022年底推出ChatGPT後,这款由大型语言模型(LLM)驱动的聊天机器人迅速掀起了人工智慧(AI)的革命,成为全球焦点,ChatGPT不仅在媒体上占据了大量版面,也引发了X、Google、Amazon、微软和Meta等科技巨头的关注,使这些公司也纷纷启动自己的生成式AI项目。
ChatGPT迅速掀起了人工智慧(AI)的革命,也使科技巨头们纷纷发展自己的生成式AI项目。(图/123RF)尽管OpenAI提供的ChatGPT Plus订阅服务每月收费20美元,但免费用户依然可以享受多项功能,包括访问GPT Store使用自订GPT机器人、生成图片、体验「记忆」功能以保持对话连续性、上传照片和文件进行讨论、让机器人进行网页浏览以提供更即时的资讯、使用进阶数据分析工具,以及访问最新的GPT-4o mini和GPT-4o模型等。
更多新闻:写履历写论文 ChatGPT 能帮什麽忙
如何使用ChatGPT?
ChatGPT提供了多种免费功能,以下是使用该AI聊天机器人的步骤:
访问ChatGPT.com
要使用ChatGPT,首先,要打开ChatGPT.com,现在用户无需在OpenAI官网创建帐号,即可使用ChatGPT,但若要使用GPT-4o、查看历史对话、生成图片或上传文件,则仍需创建一个免费帐号,若要使用ChatGPT Plus也需要登入帐号。
学习使用ChatGPT介面
进入ChatGPT後,用户就需要熟悉其操作介面,以下是主要功能简介:
- 左侧有「新对话」按钮,可以让用户随时开始新的对话。
- 对话历史记录会保存在侧边栏,方便用户日後查阅,用户也可以分享、编辑标题、关闭历史记录或删除对话。
- 点击左下方的帐号名称,即可查看帐户资讯及设置,或是登出、订阅ChatGPT Plus。
- 对话介面上方有模型选择功能,包括ChatGPT Plus、ChatGPT和临时对话模式,不同模式下的功能略有不同,临时对话不会保留历史记录,且资料也不会被用来训练模型。
- 用户的问题或提示会出现在对话介面中间。
- ChatGPT的回应则显示在问题下方,并提供「朗读」、「复制」、「重新生成」和「更换模型」等选项,此外,用户还可以为回应提供回馈。
开始输入提示或问题
掌握基本操作後,大家就可以开始向ChatGPT提问,体验这款AI工具的多样功能,无论是日常生活还是工作项目,ChatGPT都能提供帮助,包括软体开发、写作和翻译等,只要输入任何自己问题,ChatGPT就会开始处理,并提供回覆。
一些使用 ChatGPT 的有效提示
从论文写作到总结书籍,ChatGPT 可以成为内容创作的宝贵工具,结果的品质取决於提示的品质,以下则为一些值得尝试的提示。
- 电脑如何储存和处理资讯?
- 分析这段程式码并告诉我如何修复它,(贴上程式码)。
- 以华特·惠特曼(Walt Whitman)的风格写一首关於偏头痛的诗。
- 病毒和细菌有什麽差别?
- 请为我不得不缺席的孩子写一张病假条。
- 写一首关於(主题)的歌曲/诗歌。
- 给它一份你的食品储藏室里的食材清单,并要求其写一个食谱。
AMD豪砸49亿美元买下ZT Systems 专家分析动作频频原因
记者/彭梦竺
晶片制造商超微AMD最近可以说是动作频频,近日他们宣布以总价值49亿美元的价格,收购云端运算和AI资料中心设备设计商ZT Systems,希望藉此强化在AI运算方面的实力,挑战辉达NVIDIA的主导地位。微驱科技总经理吴金荣分析认为,AMD此举应是为了强化资料中心的基础设备。
AMD近日宣布以总价值49亿美元的价格,收购云端运算和AI资料中心设备设计商ZT Systems。(示意图:123RF)AMD今年Q2营收快速追赶英特尔
谈起AMD的布局,我们先翻财报来看。2024年第二季超微营收58.35亿美元,相较2023年第二季营收53.59亿美元,成长了8.9%,与上一季营收54.73亿美元相比,成长了6.6%。反观PC、伺服器处理器的老大哥英特尔,今年第二季128亿美元,较2023年第二季营收129亿美元衰退了0.9%,与上一季营收127亿美元比较,成长0.8%。
…
苏姿丰这一动作 挑动英伟达防御意识
编译/高晟钧
AMD以近50亿美元收购云端运算和人工智慧资料中心设计商ZT Systems,增强AI实力,试图追赶英伟达在人工智慧领域的主导地位。
AMD以近50亿美元收购云端运算和人工智慧资料中心设计商ZT Systems。(图 / 取自AMD官网)收购ZT Systems增强AI实力
ZT Systems总部位於新泽西州,约拥有2,500名员工,年销售额超过100亿美元。AMD以现金支付ZT Systems 75%的股份,其余部分则以股票支付,总估值约50亿美元。此交易预计在明年上半年完成,ZT执行长Frank Zhang也将加入AMD,直属AMD资料中心负责人Forrest Norrod。
更多新闻: AI 投资回报要多久 看AMD苏姿丰怎麽说
AMD执行长苏姿丰在接受采访时表示,AI系统将是首要战略重点。ZT的加入将为AMD建立大型资料中心,以串联晶片训练人工智慧系统,并开发最新的AI图形处理单元(GPU),提供给微软和脸书母公司Meta Platforms等大型云端运算公司。
与英伟达战斗升级
英伟达也於2020年以每股125美元收购网路公司Mellanox,交易金额约为69亿美元。NVIDIA 的运算平台和 Mellanox 的互连技术可为是相得益彰,收购 Mellanox後,NVIDIA将能最佳化资料中心规模的运算负载量,囊括所有运算、网络和储存堆叠,为客户达到更高效能、更高的利用率与更低的营运成本。
另一方面,AMD近十余年也是动作频繁,包括2006年以54亿美元收购 ATI Technologies、2022年先後以19亿美元和总交易金额约500亿美元的全股票收购新创公司Pensando Systems和晶片制造商Xilinx。
尽管英伟达依旧是迄今为止人工智慧产业的霸主,但AMD仍不断积累实力。上个月,AMD公布了第二季度的业绩,营收高达58亿美元,其中AI晶片的销售额便高达一半。ZT的加入很可能在现有基础上,进一步加强AMD在AI运算领域的实力,预计在2025年底,ZT Systems将为AMD在实质财务表现上做出贡献。
资料来源:WSJ
※探索职场,透视薪资行情,请参考【科技类-职缺百科】帮助你找到最适合的舞台!
…
谷林运算自动化大展秀三大主轴!全新 GenAloT 工业数据平台亮相
2024 台北自动化工业大展今日在南港展览一馆登场,新创 GoodLinker 谷林运算会中推出专为工业设备和环境监测打造的数据分析解决方案「GenAIoT 工业数据平台」,结合 AWS 强大的 AI 技术,能有效收集、汇总,进而分析来自机械设备及各类感测器的数据,提供企业数据加值服务。
谷林运算执行长冯辉译表示,制造业投入数位化和智慧化转型是大势所趋,当生产设备都联网,收集到的大量生产数据,需要仰赖 AI 人工智慧进行分析,并转换成可判读的资讯,才能帮助企业主做出正确的决策,进一步优化生产效率及营运绩效,实现智慧工厂成本及效能的最佳化。
冯辉译指出,「GenAIoT 工业数据平台」可大幅提升制造场域运作效率,为 plug and play(随插即用)的 AI 服务,无须投入大量研发资源客制开发建立深层架构,适合中小型制造业,以云端的方式提供生成式 AI,企业接受度更高,相信更容易普及。
冯辉译说明,「GenAIoT 工业数据平台」将制造场域收集到的产量、停机时间、稼动状况、温度、湿度、电力、压力、水位等数据,集中存储在云端资料库中,企业可以随时查看和管理自己的数据资产,进一步提升数据的应用价值。
冯辉译分享,谷林运算瞄准系统整合商、数位转型顾问、软体整合商及云端分析与 AI 厂商展出三大主轴,包括「绿色机联网服务」工程顾问、「企业云端战情室」及「GenAIoT 工业数据平台」,提供全面的工业数据解决方案,协助制造业客户建立可持续且具竞争力的数据。
此外,谷林运算会中邀请到 360 度全景影像解决方案提供商「Cupola 酷博乐」共同参展,并在工控场域导入 Cupola360 全景摄影机,可直观远端管理、串接现场即时数据,全天候零死角,云端战情室即刻升级为「360 企业战情室」,带来生产管理的全新体验。
(首图来源:谷林运算)
…Microchip推出100BASE-T1/1000BASE-T1 PHY收发器
Microchip Technology宣布推出LAN887x乙太网路PHY收发器系列,进一步扩展单对乙太网路(SPE)解决方案。该系列收发器支援100Mbps至1,000Mbps的1000BASE-T1网路速度,电缆长度可达40米,能够实现更长的传输距离。
单对乙太网路(SPE)具有降低成本、重量和电缆复杂性的系统级优势,汽车和工业市场正在广泛采用单对乙太网路解决方案进行网路连接。SPE凭藉在汽车应用中成熟的效能和可靠性,现在也被部署到航空电子、机器人和自动化等其他领域。为了实现跨产业互操作性,Microchip的LAN887x PHY设计完全符合1000BASE-T1规范的IEEE 802.3bp和100BASE-T1规范的IEEE 802bw-2015标准。
Microchip与新罕布夏大学大学互操作性实验室(UNH-IOL)合作,创建了1000BASE-T1一致性开发测试平台。对於许多在恶劣环境中运行并需要承受极端温度的汽车和工业应用,这些元件还符合ISO 26262的ASIL-B功能安全要求。
这些元件提供先进的诊断功能,包括电缆故障检测、讯号品质指示器、链路中断和错误、内建自检以及温度和电压监控,以提高可靠性。为了灵活应对终端应用的不同连接要求,LAN887x PHY支援电缆长度最长达15米的Type A操作和支援电缆长度最长达40米的Type B操作。两种操作类型都包括四个在线连接器。
LAN887x是一款采用EtherGREEN技术的低功耗解决方案,可提高能效。OPEN Alliance TC10休眠和唤醒功能可提供额外的功耗节省,待机功耗最大为16µA,可延长电池应用的工作时间。可选的整合线性稳压器可减少设计中的元件数量,进而最佳化BOM成本。
Microchip的USB和网路业务部副总裁Charles Forni表示,Microchip的综合解决方案包括PHY收发器、桥接元件、交换器和开发板,使设计人员能够更轻松地在设计中部署单对乙太网路技术。低功耗休眠、扩展电缆覆盖范围功能和功能安全支援使LAN887x元件成为多功能、强大的解决方案,持续支援客户不断扩大的网路需求。
LAN887x PHY与Microchip各类微控制器(MCU)、微处理器(MPU)、系统单晶片(SoC)元件和乙太网路交换器产品组合相容。Microchip提供日益广泛的SPE解决方案,包括PHY、控制器和交换器,支援10Mbps至1,000Mbps的资料传输速度。
LAN887x系列PHY收发器由全面的硬体评估平台、Type A和Type B媒体转换器套件、SFP(SGMII)、USB和PCIe插件板以及Linux软体驱动程式提供支援。
LAN8870、LAN8871和LAN8872现已量产。…
艾迈斯欧司朗推出8通道915nm SMT脉冲雷射器
艾迈斯欧司朗宣布,将推出创新的高效能8通道915nm SMT脉冲雷射器SPL S8L91A_3 A01,为自动驾驶赋予能量,简化系统设计并提升效能,使长距离探测的LiDAR更高效和可靠。采用QFN封装的SPL S8L91A_3被应用到客车、卡车和无人驾驶出租车等自动驾驶汽车的LiDAR系统中,大幅提升了自动驾驶系统的运行,导航,和数据处理能力。
自动驾驶应用中,SPL S8L91A_3 A01被应用於旨在显着提升远距离高分辨率LiDAR系统。凭借AEC-Q102认证且采用QFN封装的8通道EEL(边缘发射雷射器),艾迈斯欧司朗现在提供更加多样化的红外线元件供系统开发人员选择。该款新产品的峰值光功率为1,000W,效率达30%,效能出众。
自动驾驶是讨论最多的关於未来的话题之一,大多数系统供应商坚信,LiDAR对高阶自动驾驶必不可少。20多年来,在汽车LiDAR脉冲红外雷射器的开发和生产领域,艾迈斯欧司朗一直是自动驾驶市场的参与者,交付的产品已超过2,000万台。SPL S8L91A_3 A01是基於公司在汽车LiDAR技术领域丰富经验而推出的最新产品阵容。
SPL S8L91A_3 A01是先进的红外高功率SMT雷射器,为LiDAR应用量身打造,采用单片整合8通道设计,每个雷射器通道提供125W的功率,即总峰值光功率为1,000W,大幅地增强对高速公路自动驾驶至关重要的远距离LiDAR系统的效能。该款雷射器有4个可单独寻址的阳极,每个阳极连接到两个并行操作的雷射器通道。得益於寻址功能,客户能够灵活地设计最终产品。
采用一体化雷射器封装可以实现更紧凑、更高效的设置,无需多个元件之间对准,因此设计和制造过程得以简化。这种整合不仅缩短开发时间,还显着提高最终产品的可靠性与效能。该款雷射器的设计中采用艾迈斯欧司朗专有的波长稳定技术,可大幅减少因温度变化引起的波长漂移,进而提高LiDAR系统的讯噪比(SNR)并扩大侦测范围。
SPL S8L91A_3 A01旨在满足汽车产业的严格要求,效能规格符合并超越AEC-Q认证标准。该款雷射器的QFN封装是保障可靠设计的关键,可提供满足汽车环境挑战的持久解决方案。除可大规模应用於自动驾驶汽车的LiDAR系统之外,该新款雷射器可应用於工业LiDAR,可提升机器人、安全监控、智慧城市和最後一公里交付等应用的效能。
艾迈斯欧司朗LiDAR资深首席工程师Clemens Hofmann指出,该公司的新款8通道雷射器模组将为自动驾驶产业带来革新。它能够简化系统设计并提升效能,使远距离LiDAR系统更加有效和可靠。透过整合艾迈斯欧司朗先进的波长稳定技术,可确保在不同工作条件下都能保障优异的效能。
SPL S8L91A_3 A01将於2024年秋季推出。…
欧盟2024统一充电规格快跟上 全面盘点合规重点
为减少环境废弃物以及增加使用者便利性等目的(图1),欧洲议会(European Parliament)先後於2022年10月和2023年6月通过针对《无线电设备指令》(Radio Equipment Directive,……
AI 会愈来愈笨吗 模型崩溃怎麽办
编译/黄竣凯
随着生成式人工智慧(AI)的蓬勃发展,业界开始讨论一个令人担忧的「模型崩坏」(model collapse)现象,尽管这一概念早在2023年已被提出,但近期才逐渐受到广泛关注,所谓「模型崩坏」指的是,随着网路上AI生成内容的增多,未来的AI系统将因过度依赖这些低品质数据,而变得愈来愈「笨」的假设性情境。
随着生成式人工智慧(AI)的蓬勃发展,业界开始讨论一个令人担忧的「模型崩坏」现象。(图/123RF)AI发展的隐忧
据报导,目前的生成式AI系统,如OpenAI的ChatGPT、Google的Bard和Meta的LLaMA,依赖大量高品质的数据进行训练,通常来自网路上的人类创作内容。然而,随着AI技术自2022年起的普及,AI生成的内容在网路上的占比逐渐增长,并且成为新的数据来源,许多研究者就开始探讨,是否可以仅依赖AI创造的数据进行训练,而不再需要人类数据。
更多新闻:加密货币挖矿、AI数据中心碳排高 要被加税了
然而,尽管基於AI生成的数据成本更低,且不涉及伦理或法律风险,这一方向看似具有吸引力,但研究结果显示,缺乏高品质的人类数据,AI系统的训练效果会逐渐下降,导致模型行为的品质和多样性变差,就像是「数位近亲繁殖」一样,最终可能导致AI系统因一再从已有的AI数据中学习而退化,失去原本的实用性。
避免崩坏的挑战
目前的研究结果显示,AI系统无法完全摆脱对人类数据的依赖,毕竟AI中的「智慧」来源,仍是人类知识,理论上,科技公司可以过滤掉AI生成的内容,但实际操作起来并不简单,大公司如OpenAI和Google已经投入大量资源清理和过滤数据,但随着AI生成内容的增多,这项工作将变得更加困难且耗费成本,且随着AI生成的内容变得越来越难以辨别,这种过滤效果将逐步递减。
资料短缺的隐忧
业内有迹象表明,开发者已经在努力寻找高品质的数据,如,OpenAI在发布GPT-4时,参与数据处理的团队人数就创下历史新高,此外,有估计指出,到2026年,人类生成的文本数据库可能会枯竭。
潜在的社会文化风险
除了技术崩坏,AI生成内容的泛滥也带来了更多隐性风险,一方面,过多的AI内容可能会损害网路上原有的人类创作,例如程式码分享网站StackOverflow,在ChatGPT发布一年後,其用户活动量下降了16%,显示出,AI辅助可能已在某些线上社群中,削弱了人与人之间的互动,另一方面,AI内容的爆发式增长,也让人难以分辨哪些内容是由人类创作,哪些是由机器生成的,尽管一些国家如澳大利亚,已经推行标注AI生成内容的临时法规,但在全球范围内实现这一目标仍面临挑战,最後,随着AI生成的内容趋於同质化,社会文化多样性可能会逐渐消失,部分群体的文化甚至面临被「抹去」的风险。
参考资料:Telegraph India
※探索职场,透视薪资行情,请参考【科技类-职缺百科】帮助你找到最适合的舞台!
…
AI 运算需求激增,美国维州「资料中心巷」用水量飙升逾六成
美国维吉尼亚州北部是资料中心选址的热门地点,形成运算基础设施集中地,自 2019 年以来,维吉尼亚州所谓「资料中心巷」(data centre alley)数十个运算基础设施,用水总量增加近三分之二,迫使环保团体提出警告。
维吉尼亚州是全球最大规模的资料中心集中地,包括亚马逊、微软、Google 在此设有资料中心。《金融时报》透过资讯自由请求取得最新资料显示,这些部署大量电脑和网路设备的大型资料中心,2023 年至少消耗 18.5 亿加仑(约 70 亿公升)的水。
根据「资料中心巷」及周边地区如费尔法克斯郡(Fairfax)、劳登郡(Loudoun)、威廉王子郡(Prince William)、福基尔郡(Fauquier)等综合资料指出,2019 年用水量为 11.3 亿加仑(约 42.8 亿公升),相比之下,2023 年用水量增加 63.7%,不过该地区仍有供水商的数据未列入其中。
大型科技公司纷纷投入 AI 和云端竞赛,投资数百亿美元在全球兴建资料中心。而 AI 是能源密集和运算密集下的产物,微软和 Google 等希望 AI 成为下一个利润丰厚的收入来源。
资料中心运用水来冷却运算设施,同时也运用在发电等过程。根据研究机构 Dgtl Infra 估计,美国资料中心 2023 年总共消耗超过 750 亿加仑(约 2,839 亿公升)的水,相当於伦敦整整 …