和電腦對弈也可以變棋王 交大CGI計畫團隊發表圍棋終身學習系統

紅面棋王周俊勳與交大所研發的圍棋終身學習系統對弈

交通大學吳毅成教授所帶領的「CGI圍棋程式」團隊日前發表圍棋終身學習系統研究成果,首創能提供多達40個穩定棋力等級之圍棋程式,可以從初學開始,甚至到超越棋王。同時也開發出棋力檢測系統,能自動檢測出棋士的棋力,提供更客製化的圍棋訓練。

要電腦多想一點?還是少想一點?

吳毅成教授表示,現在的圍棋程式的棋力,大都遠超過高段棋士,在過去與海峰棋院的合作中,經常碰到的一個問題是:即使棋士的棋力進步了很多,但是還是輸給程式,因此無法從與電腦程式對弈中,感受到自己棋力的進步。「當紅面棋王周俊勳告訴我們這個問題後,激發了我們研究不同等級棋力這議題的動機。」對於這個問題,很多人首先會想到的是讓程式「少想一點」,棋力自然變弱。

吳毅成教授表示,根據過去文獻的研究顯示,「少想一點」會讓下法變得更單調,且更容易被破解;造成棋力較弱的對手也可以容易獲勝,因此無法獲得穩定的棋力,會讓棋力評估失真。再來,很多人會想到的另一種方法是,針對每個等級棋力,訓練出一套程式;然而圍棋從初學到超越棋王,有將近40多個等級的棋力,若對每個等級都設計一套程式,且每個等級的程式,都要調整很多參數來控管棋力品質,時間成本相當高,實際上幾乎不太可能。

選擇適合自己的強度來進行培訓

交通大學表示,CGI團隊針對上述的問題,發明了一套簡潔的方法,可以讓一個程式穩定的降低棋力將近10多個圍棋等級,大約涵蓋1000國際ELO等級分。基本想法是讓程式不要每次都選擇最好的棋步,偶爾要下一些較弱的走步,來減弱程式的棋力。然而,較弱棋步出現的頻率以及選下哪些較弱棋步,是需突破的困難問題。對此,CGI團隊提出類似物理常用的亂度(Entropy)作為棋力指標,來當作選擇弱棋的頻繁度,同時為了避免下到太弱的棋步,也提出了門檻,保障穩定的棋力強度。

交通大學表示,CGI團隊與「海峰棋院」棋士合作,同時也在世界最大的兩個圍棋網站中測試──韓國Tygem圍棋網站與中國野狐圍棋網站,均得到正面的結果。「海峰棋院」的紅面棋王周俊勳在初步測試之後,能明顯感受電腦各棋力等級程式的差異,並選擇適合自己的強度來進行培訓;曾獲17屆全國女子圍棋公開賽冠軍的楊子萱棋士也認為「CGI新招變多」,且能透過棋局學習並改進棋步;職業二段棋士盧奕銓則表示CGI的分級程式「讓思路開闊了不少」、「令人耳目一新」。顯示CGI在降低棋力的同時,還可以保持下法的多樣性,這是單純讓程式「少想一點」的方法所做不到的。

首創圍棋棋力自動檢測系統

此外,CGI團隊更首創圍棋棋力自動檢測系統,棋士不需要指定等級,系統會自動給予使用者合適的等級訓練,並偵測出下棋者的棋力。新科職業初段棋士牛詩特在下棋的過程中,發現程式有因應棋力調整強度,他說:「電腦明顯比前幾天強很多,尤其計算力提升不少」;今年拿下十段賽冠軍取得十段頭銜,現為四冠王的許皓鋐棋士也感受到CGI動態地調整強度。

吳毅成教授說,CGI團隊從CGI 1.0版升級至CGI 4.0版,剛好足以涵蓋40個等級棋力,已與全世界最強的開源圍棋程式–––ELF OpenGo棋力相當。任何想學圍棋的人,從初學到超越棋王程度,都可以在這套系統找到相對應棋力的程式,可以長期陪伴學習者成長,以達到終身學習的效果,未來還會考慮發給受測者「CGI段級位證書。」

★教育新知不漏接!立即加入教育家部落格★