2025年4月29日,阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3,作為Qwen系列的最新一代大型語言模型(LLM),包含一系列密集型(Dense)和混合專家(MoE)模型,參數(shù)規(guī)模從0.6億至2350億不等。同日,海光信息技術股份有限公司(以下簡稱“海光信息”)在其“智能深算”戰(zhàn)略引領下,宣布其深算單元(DCU,Deep Computing Unit)已完成對Qwen3全部8款模型(235B、32B、30B、14B、8B、4B、1.7B、0.6B)的無縫適配與優(yōu)化,實現(xiàn)零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構的生態(tài)優(yōu)勢和海光DTK軟件棧的領先特性,展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性,充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術優(yōu)勢,使其成為支撐AI大模型訓練與推理的關鍵基礎設施。
NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務,能夠為各行業(yè)構建 AI 的企業(yè)提高 AI 的準確性、安全性和可控性。
今年9月份OpenAI對外宣稱,AI能力達到新等級,相比之前的LLM,新AI更接近人類的思考能力。OpenAI的斷言引起爭論:到底還要等多久機器才能具備人類大腦一樣的認知能力?
人工智能正在改變我們的世界,推動前所未有的增長和創(chuàng)新。這場革命的核心是高性能芯片,其特點是復雜性、精度要求和先進技術的集成度不斷提高。
大型語言模型 (LLM) 的出現(xiàn)導致人們急于將人工智能 (AI) 強行塞入每一種有意義的產(chǎn)品,以及相當一部分不有意義的產(chǎn)品。但有一個領域已經(jīng)證明人工智能是一個強大而有用的補充:低代碼和無代碼軟件開發(fā)。
隨著最近法學碩士 (LLM)的成就和關注,以及隨之而來的人工智能“夏季”,模型訓練方法開始復興,旨在盡快獲得最優(yōu)、性能最佳的模型。其中大部分是通過大規(guī)模實現(xiàn)的——更多芯片、更多數(shù)據(jù)、更多訓練步驟。然而,許多團隊一直專注于如何更高效、更智能地訓練這些模型,以實現(xiàn)預期結果。
本文根據(jù)完整的基準測試,將Achronix Semiconductor公司推出的Speedster7t FPGA與GPU解決方案進行比較,在運行同一個Llama2 70B參數(shù)模型時,該項基于FPGA的解決方案實現(xiàn)了超越性的LLM推理處理。
5 月 20 日,英國政府下屬人工智能安全研究所(AISI)發(fā)布了最新的 LLM 安全評估等三則公告。
事實表明,AI無法替代開發(fā)者,但更適用于優(yōu)秀的開發(fā)者。而識別大型語言模型(LLM)生成的代碼什么時候會出錯,需要開發(fā)人員具有豐富的知識和經(jīng)驗。
2022年11月30日,ChatGPT正式上線。以其為代表的生成式AI顛覆了人們對于生產(chǎn)力的認知,而此后整個2023年,科技巨頭紛紛強勢入局,各種大語言模型也蜂擁而至。經(jīng)過了一年的沉淀,從底層大模型、到基礎設施、再到消費端應用,生成式AI的生態(tài)已經(jīng)初步建立。
全新 GeForce RTX SUPER GPU、各大OEM的AI筆記本電腦為領先的AI平臺帶來 RTX 加速
波士頓動力公司、Collaborative Robotics、Covariant、Sanctuary AI、宇樹科技等企業(yè)正在將 LLM 應用于機器人領域
Arm? 今日宣布多項全新的戰(zhàn)略合作,繼續(xù)致力于推動人工智能 (AI) 的創(chuàng)新,并將 AI 的體驗變?yōu)楝F(xiàn)實。除了自身已能實現(xiàn) AI 開發(fā)的技術平臺之外,Arm 還與 AMD、英特爾、Meta、微軟、NVIDIA 和高通技術公司等領先的科技企業(yè)攜手合作,通過多項計劃,聚焦于先進 AI 能力的實現(xiàn),由此帶來更快響應、更加安全的用戶體驗。這些合作計劃將在所有計算進行之處,助力 1500 多萬名 Arm 開發(fā)者,構建其所需的基礎框架、技術和規(guī)范,帶來新一代的 AI 體驗。
AI 智能體利用 LLM 自動生成獎勵算法,訓練機器人完成復雜任務。