用語音就能操控機械臂 湖大研究生團隊這項作品獲得國獎
用語音就能操控機械臂運動。9月25日,湖北大學物理與電子科學學院研究生團隊《基於FPGA的語音識別機械臂係統》項目突破重重難關,曆時近四個月,從5824支隊伍中脫穎而出,斬獲中國研究生電子設計競賽一等獎。
“聽看傳”板塊聯動 機械臂實現抓取
該係統主要由語音識別係統、視覺識別攝像頭和單片機控製部分組成。
打開開關,語音識別係統自動運行。“紅色!”團隊隊長曾文平一聲令下,語音識別係統將解析後的語音數據結果發送給攝像頭,攝像頭立即開始捕捉桌麵上紅色色塊,並將其位置坐標傳輸到單片機。伴隨著滋滋滋的電流聲,黃色的機械臂根據單片機逆運動解算的結果,隨著軸承緩緩旋轉、下降,將桌麵上的紅色色塊牢牢抓住,運送到桌麵另一處放下,這個過程實際運行時間僅30秒。
“隨著中國社會人口老齡化加劇,對於醫療護理機器人的需求也會大幅提升,《基於FPGA的語音識別機械臂係統》可以應用於醫療行業,通過語音操控的機械臂將極大程度優化老年人醫療體驗,減輕醫生護士的看護壓力。”團隊指導老師宋敏說。
在作品的設計過程中,最具突破性的點是團隊三人負責板塊之間的聯動,歐陽一博負責語音係統,曾文平負責機械臂控製和攝像頭,劉子涵負責通訊接口。曾文平設計的作品曾在湖北大學集成電路創新創業大賽獲得二等獎,由於當時用到了機械臂,團隊指導老師宋敏便建議他以這項作品為基礎組隊參加比賽。他第一時間就找到了劉子涵和歐陽一博:“他們兩人在機械臂設計上都有自己的成果,把原有的設計成果進行整合,設計出來的作品能實現一加一大於二的效果。”
廣泛搜集 建立語音識別數據庫
語音數據的識別是項目設計的一大難點。設計初期,團隊收集的數據有限,在數據處理完成後,他們發現語音識別係統並不能很好地識別各種年齡段的語音。為了使語音識別的數據庫更加充分,團隊自建數據庫,耗時一個多月,找來兩百多人進行語音內容的錄製,提高了機械臂語音識別的泛化能力。
團隊的成員歐陽一博在語音識別部分充當了核心角色,他告訴記者:“語音識別對廣泛性要求很高,找人的過程雖然困難,但有了這兩百多人的數據,大部分人的語音指令都可以輕鬆地識別。”
團隊優勢互補 高效研發合作
決賽的準備時間是在暑假,團隊成員歐陽一博因為個人原因在酒店隔離。在他負責的語音係統設計部分,歐陽一博每天和其他成員進行視頻溝通,請團隊成員幫忙檢查優化自己的部分。檢查數據、維修線路、總結問題並提出解決措施.....每天工作結束後,三人又開始對一天的修改和優化工作進行複盤。“累是真的累,但每次我們發現可以優化的細節,我們覺得一天的工作都是值的。”劉子涵說。
“我常常說能力和成績可以不是最出色的,但是態度一定要端正。”指導老師宋敏對團隊的作品完成要求很高,每一步都會進行檢查與指導。宋敏每次實驗都會給團隊成員知道答辯和試驗技巧,團隊成員也經常向老師分享自己在實驗期間的困惑。“能拿到國獎是我們沒有想到的,但是他們用行動證明我們的團隊可以創造奇跡。”宋敏說。
“最大的收獲就是確定了自己在語音識別方麵的研究方向。”談到自己在本次研電賽中取得的收獲,歐陽一博說,“在研究過程中也擁有了卷積神經網絡語音識別係統和智能化語音識別技術應用管理係統兩項軟件著作權。”
宋敏介紹,自學校研究生工作部、研究生院於2021年首次啟動“一院一賽”工程後,她每次都會帶領學生參加學科性競賽。“這次獲得一等獎,學校和學院都全程跟進我們這次比賽,提供人力物力的全麵支持,有了學校的支持與鼓勵,我們才能更好地沉下心來投身科研,參加比賽。”(beplay2網頁登錄 通訊員 李垠璋 熊思穎)
免責聲明:
① 凡本站注明“稿件來源:beplay2網頁登錄”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式複製發表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:beplay2網頁登錄”,違者本站將依法追究責任。
② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出於非商業性的教育和科研之目的,並不意味著讚同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯係。