<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>GUI</title>
	<atom:link href="https://news.111.net.tw/archives/tag/gui/feed" rel="self" type="application/rss+xml" />
	<link>https://news.111.net.tw</link>
	<description></description>
	<lastBuildDate>Tue, 11 Nov 2025 10:54:44 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.1</generator>

<image>
	<url>https://news.111.net.tw/wp-content/uploads/2025/07/news.111.net_.tw-favicon.png</url>
	<title>GUI</title>
	<link>https://news.111.net.tw</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>全球雙榜SOTA！明略科技專有大模型 Mano開啟GUI智能操作新時代</title>
		<link>https://news.111.net.tw/archives/20270</link>
		
		<dc:creator><![CDATA[terry@111.com.tw]]></dc:creator>
		<pubDate>Mon, 06 Oct 2025 10:48:18 +0000</pubDate>
				<category><![CDATA[工商]]></category>
		<category><![CDATA[科技]]></category>
		<category><![CDATA[GUI]]></category>
		<category><![CDATA[Mano]]></category>
		<category><![CDATA[SOTA]]></category>
		<category><![CDATA[大模型]]></category>
		<category><![CDATA[智能操作]]></category>
		<guid isPermaLink="false">https://www.111.net.tw/archives/6673?refresh=1759858205391&#038;refresh=1762858484255</guid>

					<description><![CDATA[北京2025年10月6日 /美通社/ &#8212; 2025年，Agent無疑是AI圈的熱詞。行業普遍認為： [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><span class="legendSpanClass">北京</span><span class="legendSpanClass">2025年10月6日</span> <span>/美通社/ &#8212; 2025年，Agent無疑是AI圈的熱詞。行業普遍認為：真正有用的Agent，必須學會使用手機和電腦，像人一樣操作GUI。</span></p>
<p class="prntaj"><b><span>近日，中國企業級大模型與數據智能企業——明略科技推出的專有</span></b><b><span>GUI大模型 Mano在行業公認的Mind2Web和OSWorld兩大基準測試中，均取得了創紀錄的SOTA成績。</span></b><span>通過在線強化學習和訓練數據自動採集兩大核心創新，</span><span>Mano為GUI智能體領域提供了一套可擴展、可持續進化的新範式。</span></p>
<div class="PRN_ImbeddedAssetReference">
<p><a href="https://mma.prnasia.com/media2/2789410/Mano_achieved_SOTA_Foundation_E2E_GUI___Specialized_Model_Evaluation.html" target="_blank" rel="nofollow"><img decoding="async" src="https://mma.prnasia.com/media2/2789410/Mano_achieved_SOTA_Foundation_E2E_GUI___Specialized_Model_Evaluation.jpg?p=publish" title="Mano在OSWorld-Verified榜單的Foundation E2E GUI &amp; Specialized Model評測中取得SOTA。" alt="Mano在OSWorld-Verified榜單的Foundation E2E GUI &amp; Specialized Model評測中取得SOTA。"/></a><br /><span>Mano在OSWorld-Verified榜單的Foundation E2E GUI &amp; Specialized Model評測中取得SOTA。</span></p>
</div>
<p class="prntaj"><span>榜單鏈接：</span><a href="https://os-world.github.io/" target="_blank" rel="nofollow">https://os-world.github.io/</a><br /><span>技術報告鏈接：</span><a href="https://www.mininglamp.com/news/6394/" target="_blank" rel="nofollow">https://www.mininglamp.com/news/6394/</a></p>
<p class="prntaj"><b><span>關鍵突破：</span></b></p>
<p class="prntaj"><b><span>1．Mind2Web：</span></b><span>Mind2Web覆蓋137個網站、2350+真實任務，旨在考察智能體能否在複雜多變的DOM結構裡精準找到目標元素，並完成整個操作鏈。<b>Mano展示出「看得準、做得成」的核心優勢。</b></span></p>
<p class="prntaj"><span>技術報告顯示，</span><span>Mano的元素精度 (Ele.Acc）和步驟成功率（Step SR）指標遙遙領先，在準確識別、定位界面元素，以及成功執行多步任務能力上達到新高度。Mano的操作F1 (Op.F1) 指標與此前頂尖模型持平甚至略高，能夠真正將複雜任務轉化為成功的操作序列。</span></p>
<p class="prntaj"><b><span>2. OSWorld-Verified：</span></b><span>更難的挑戰來自桌面端。</span><span>OSWorld-Verified涵蓋了369個跨應用任務，覆蓋10類應用，包含瀏覽器，辦公軟件等多個類型，每一個操作都和真實桌面場景無縫對接。</span></p>
<p class="prntal"><span>技術報告顯示，在</span><span>OSWorld-Verified榜單的Foundation E2E GUI &amp; Specialized Model 評測中，<b>Mano直接把成功率提升到 41.6±0.7%，超過qwen、GUI-Owl、opencua等模型。</b></span></p>
<p class="prntaj"><b><span>技術創新：</span></b></p>
<p class="prntaj"><b><span>亮點一：首次提出「在線強化學習」</span></b></p>
<p class="prntaj"><span>自</span><span>DeepSeek橫空出世以來，GRPO已經成為強化學習黃金範式。現有的模型訓練大多局限在離線強化學習的範疇，深度依賴事先收集好的數據集。但在GUI交互智能體領域，任何操作都與真實的系統交互環境密切相關。</span></p>
<p class="prntaj"><span>因此，</span><b><span>Mano在GUI交互領域首次提出「在線強化學習」的訓練範式，並推出訓練數據自動採集的「探索器」，</span></b><span>讓智能體時刻依賴最新數據進行學習，並在「嘗試新的行動以獲取信息」和「基於已有知識採取最優行動」之間取得平衡。</span></p>
<p class="prntaj"><span>為了在真實的交互環境中不斷強化以提高適應性和靈活性，明略科技建立了一個<b>模擬環境池，</b>包括瀏覽器環境（</span><span>BUA）和桌面環境（CUA），讓模型在真實交互中採集更多樣化的環境數據，彌補了離線軌跡分佈稀疏的局限性，最終在多樣化的Web GUI場景中展現出更強的魯棒性。</span></p>
<p class="prntaj"><span>同時，採用<b>在線採樣</b></span><b><span> + 離線過濾</span></b><span>的創新方式：先收集軌跡，再過濾噪聲數據，動態調節任務難度分佈，有效避免了因失敗軌跡導致學習效率低下的問題。</span></p>
<p class="prntaj"><span>消融實驗結果顯示，加入在線強化學習後，模型在</span><span>OSWorld-Verified數據集的平均分數產生了質的飛躍，<b>相比離線強化學習的模型結果提升了</b><b> 7.9，達到 41.6。</b></span></p>
<p class="prntaj"><b><span>亮點二：智能探索，採集真實環境軌跡</span></b></p>
<p class="prntaj"><span>儘管大模型能夠理解籠統的指令，但在多步驟操作的目標驅動型任務中，往往無法將大目標分解為具體的執行步驟。因此，研發人員需要為交互任務構建專用的模型和智能體。在這一過程中，海量的高質量交互軌跡數據不可或缺。過去，這類數據往往需要人工構建或標注，成本高、耗時長。對此，<b>明略科技設計了訓練數據自動採集的方法，從根本上提升了數據收集的效率和準確性，這正是</b></span><b><span>Mano的第二大創新。</span></b></p>
<p class="prntaj"><span>明略科技搭建了一個可擴展的虛擬環境集群，用於模擬多種交互場景。針對每個目標應用，大模型自動生成目標清單，並對目標進行優先級排序，過濾掉使用頻率極低的功能，為後續探索提供明確的上下文指導。</span></p>
<p class="prntaj"><span>元素提取方面，明略科技為網頁環境定制了</span><span>Chrome插件「Mano-C」，全面提取網頁中的交互元素，捕捉其空間坐標與語義屬性。針對桌面環境，技術團隊則採用A11y Tree解析與 OmniParseV2協同過濾的方法，確保覆蓋更多交互元素。</span></p>
<p class="prntaj"><span>數據標注方面，明略科技利用大模型為每個提取的元素生成語義標籤、功能描述，以及交互類別，形成結構化的語義對齊數據，為後續訓練提供有效監督。</span></p>
<p class="prntaj"><span>為了提升數據採集的智能程度，技術團隊設計了基於</span><span>Prompt的探索模塊，用於智能選擇交互元素，並引入顯式約束，避免路徑循環和冗余分支。在探索過程中，採用深度優先搜索（DFS）策略，系統會截取截圖並保存帶註釋的交互數據。完成探索後，通過軌跡評估機制，篩選出高質量的交互序列。整個過程不斷循環，每一步都會檢查是否達到最大探索深度。</span></p>
<p class="prntaj"><b><span>Mano的SOTA表現，得益於明略科技多年來在大模型領域的積累。</span></b><span>2024年，明略科技的超圖多模態大語言模型（HMLLM）和Video-SME數據集在腦電圖、眼動等非標模態數據處理領域取得顯著突破，榮獲ACM MM 2024最佳論文提名。2025年，明略科技推出企業級商業數據分析可信智能體<b>DeepMiner</b>，Mano作為DeepMiner的自動化執行引擎，讓智能體真正學會了「看」與「點」，在複雜的軟件與瀏覽器環境下實現了精細化操作。展望未來，明略科技將進一步優化Mano在應用和端側部署能力，加速企業智能化轉型進程。</span></p>
<div class="PRN_ImbeddedAssetReference">  </div>
<!-- NEWS_AUDIT_WARNING -->
<div style="background-color: #fff3cd; border: 1px solid #ffeaa7; padding: 10px; margin: 10px 0; border-radius: 5px;"><strong><img src="https://s.w.org/images/core/emoji/15.1.0/72x72/26a0.png" alt="⚠" class="wp-smiley" style="height: 1em; max-height: 1em;" /> 重要提醒：</strong> 1. 謹防誇大宣傳，避免不實陳述。2. 重視數據安全和隱私保護，確保數據收集、處理和使用符合相關法律法規要求。3. 注意技術倫理，避免不當模仿人類能力。4. 關注廣告法規，避免違反廣告法的相關規定。</div>]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
