艾山·吾买尔
|
教授、博士、博士生导师、自治区天山英才入选者、自治区青年博士人才入选者、2010年优秀博士学位论文获得者、计算机科学与技术半岛体育在线(中国)有限公司官网副院长
研究领域:多模态自然语言处理(语音识别、语音评测、对话技术、机器翻译、视觉理解)
办公室&实验室:新疆大学博达校区信息技术大楼523研究室
电子邮件:Hasan1479@xju.edu.cn
联系电话:(+86)0991-8583835
|
教育背景
2007.09-2010.07:新疆大学,信息科学与工程半岛体育在线(中国)有限公司官网,博士
2005.09–2007.07,新疆大学,信息科学与工程半岛体育在线(中国)有限公司官网,硕士
2001.09–2005.07,新疆大学,信息科学与工程半岛体育在线(中国)有限公司官网,学士
1999.09-2001.07,新疆大学,数学系,预科
工作简历
2020.12- 至今:新疆大学计算机科学与技术半岛体育在线(中国)有限公司官网教授
2010.10- 2020.12:半岛体育在线(中国)有限公司官网副教授
2007.07-2010.10:半岛体育在线(中国)有限公司官网任助教
学术兼职
下列学术组织的委员:
中国中文信息学会理事、青工委委员、机器翻译专委会委员、民族语言文字信息专委会副主任
中国人工智能学会青年工作委员会委员
中国计算机学会会员
下列期刊或者国内外会议的审稿人:
ACM Transactions on Asian and Low-Resource Language Information Processing
全国机器翻译大会
中国计算语言学大会
少数民族语言文字信息处理学术研讨会
计算机应用
研究内容
长期从事自然语言理解、机器翻译等领域研究工作,与中科院计算所、苏州大学计算机半岛体育在线(中国)有限公司官网简历紧密的合作关系,面向低资源和形态丰富等问题,提出了多种优化模型和集成方法,获得了2项自治区科技进步二等奖、1项自治区科技进步三等奖,发表论文60余篇,软件著作权50多项,受理发明专利10多项,毕业的同学在新浪、同花顺等企业从事机器翻译研究员工作。语音方向从2020年开始研究,目前1名同学在在字节跳动实习,今后该课题组聚焦汉语语音识别和评测技术开展研究。
随着多模态技术的发展,正在开展国家通用语言文字评测技术和智能学习平台的研发工作,主要开展汉语的语音识别、普通话评测、聊天机器人、语音合成、机器翻译等方面的工作。目前,在研项目经费充足,对优秀同学可以提供较高的助研津贴,充足的GPU计算设备。
主持和参与项目
纵向项目
教育厅重点项目,国家通用语言文字智能学习关键技术研发,2022.06-2023.06,220万元,主持;
国家自然科学基金地区基金,62166044,中亚地区低资源形态丰富黏着语言的神经机器翻译研究,2022.01-2025.12,35万元,主持;
国家重点研发计划子项目,2017YFB1002100,维汉机器翻译与语音、语言数据采集及处理方法研究与实现,2017.09-2020.9,171万元,主持,
国家自然科学基金地区基金,61662077,基于深度语义的汉维机器翻译研究,2017.01-2020.12,41万元,主持;
国家自然科学基金地区基金,61262060,维吾尔文命名实体识别关键技术研究,2013/01-2016/12,45.0万元,主持;
国家自然科学基金地区基金,60963018,现代维吾尔语句法分析关键技术研究,2010/01-2012/12,21.0万元,主持;
国家重点基础研究规划项目(973),2014CB340506,《面向公共安全与社会管理的互联网中文信息处理验证系统》,2013/12-2018/12,560万元,主要参与者;
天山创新团队计划,多模态信息感知与智能处理创新团队(项目编号:2020D14044),50.0万,2020/12-2022/12,第二名;
横向项目
企业横向项目,国家通用语言文字智能学习系统技术合作开发合同,2023年11月-2026年11月,300万元,主持;
北京信息科学与技术国家研究中心面向项目,BNR2021KF02005,普通话水平测试命题说话自动评测技术研,2021.10-2022.10,10万元,主持;
中科软科技股份有限公司,英、汉、维多语言自然语言处理与机器翻译平台,2017.01-2023.11,280万元,主持;
百度,百度翻译与新疆大学汉维双语句对库研制与开发,2017.01-2019.6,90万元,主持;
横向项目,少数民族语言识别、转译与理解算法引擎研发,70.0 万,2019/8-2020/8,主要参与者;
国家重点研发项目子课题,基于跨境电商体验的关键技术研究,(项目编号:2018YFB1403202),76.46万,2019/7-2022/6,主要参与者。
发表的部分论文
Wang, L., Yu, K., Wumaier, A*. et al. Genre: generative multi-turn question answering with contrastive learning for entity–relation extraction. Complex & Intelligent Systems(中科院二区). (2024). https://doi.org/10.1007/s40747-023-01321-y
Cuicui Zhu, Aishan Wumaier*, Dongping Wei, Zhixing Fan, Jianlei Yang, Heng Yu, Zaokere Kadeer, Liejun Wang,Pronunciation error detection model based on feature fusion,Speech Communication(中科院二区),Volume 156,2024,https://doi.org/10.1016/j.specom.2023.103009.
Gulinigeer Abudouwaili, Kahaerjiang Abiderexiti, Nian Yi, and Aishan Wumaier*. 2023. Joint Learning Model for Low-Resource Agglutinative Language Morphological Tagging. In Proceedings of the 20th SIGMORPHON workshop on Computational Research in Phonetics, Phonology, and Morphology,CCF A类, pages 27–37, Toronto, Canada. Association for Computational Linguistics.
C. Fan, S. Guo, A. Wumaier and J. Liu, "A cross-attention and Siamese network based model for off-topic detection," 2023 IEEE 35th International Conference on Tools with Artificial Intelligence (ICTAI) CCF C类, Atlanta, GA, USA, 2023, pp. 770-777, doi: 10.1109/ICTAI59109.2023.00118.
J. Li, R. Li, S. Guo and A. Wumaier, "Enhancing Whisper Model for Pronunciation Assessment with Multi-Adapters," 2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Taipei, Taiwan, 2023, pp. 1955-1959, doi: 10.1109/APSIPAASC58517.2023.10317374.
Nian Yi(硕士), Chenze Shao, and Aishan Wumaier. 2023. Integrating Reconstructor and Post-Editor into Neural Machine Translation. ACM Trans. Asian Low-Resour. Lang. Inf. Process. https://doi.org/10.1145/3588766.
Jiajun Liu(硕士); Aishan Wumaier; Linna Zheng; Huazhen Meng.Automatic Speech Fluency Evaluation Method Based on Multimodality for Putonghua Proficiency Test Propositional Speaking,International Journal of Asian Language Processing,2023-04-28, DOI: 10.1142/S2717554523500017
S. Guo(硕士), Z. Kadeer, A. Wumaier, L. Wang and C. Fan, "Multi-Feature and Multi-Modal Mispronunciation Detection and Diagnosis Method Based on the Squeezeformer Encoder," in IEEE Access, doi: 10.1109/ACCESS.2023.3278837.
Liu, J(硕士).; Wumaier, A.; Fan, C.; Guo, S. Automatic Fluency Assessment Method for Spontaneous Speech without Reference Text. Electronics 2023, 12, 1775. https://doi.org/10.3390/electronics12081775
Z. Fan(硕士), J. Li, A. Wumaier, Z. Kadeer and A. Abdurahman, "A Multifaceted Approach to Oral Assessment Based on the Conformer Architecture," in IEEE Access, vol. 11, pp. 28318-28329, 2023, doi: 10.1109/ACCESS.2023.3255986.
刘婉月,艾山·吾买尔,李哲等.基于多亚词序列融合的神经机器翻译[J].中文信息学报,2023,37(02):87-96+106.
J. Liu(硕士), H. Meng, Y. Shen, L. Zheng and A. Wumaier, "Multimodal automatic speech fluency evaluation method for Putonghua Proficiency Test propositional speaking section," 2022 13th International Symposium on Chinese Spoken Language Processing (ISCSLP), Singapore, Singapore, 2022, pp. 260-264, doi: 10.1109/ISCSLP57327.2022.10037908.
Gulinigeer Abudouwaili, Kahaerjing Abiderexiti, Yunfei Shen & Aishan Wumaier (2022) Research on the Uyghur morphological segmentation model with an attention mechanism,Connection Science, 34:1, 2577-2596, DOI: 10.1080/09540091.2022.2134843
Y. Shen(硕士), Q. Liu, Z. Fan, J. Liu and A. Wumaier, "Self-Supervised Pre-Trained Speech Representation Based End-to-End Mispronunciation Detection and Diagnosis of Mandarin," in IEEE Access, vol. 10, pp. 106451-106462, 2022, doi: 10.1109/ACCESS.2022.3212417.
J. Liu(硕士), H. Meng, Y. Shen, L. Zheng and A. Wumaier, "Multimodal automatic speech fluency evaluation method for Putonghua Proficiency Test propositional speaking section," 2022 13th International Symposium on Chinese Spoken Language Processing (ISCSLP), Singapore, Singapore, 2022, pp. 260-264, doi: 10.1109/ISCSLP57327.2022.10037908.
H. Meng(硕士) et al., "A Speech Recognition Method Based on Transfer Learning for PSC Topic Speaking Section," 2022 3rd International Conference on Pattern Recognition and Machine Learning (PRML), Chengdu, China, 2022, pp. 296-302, doi: 10.1109/PRML56267.2022.9882197.
T. Mao(硕士) et al., "Enriching Under-Represented Named Entities for Improved Speech Recognition," 2021 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Tokyo, Japan, 2021, pp. 1021-1025.
宜年,艾山·吾买尔,买合木提·买买提,吐尔根·依布拉音.基于多种数据筛选的维汉神经机器翻译[J].厦门大学学报(自然科学版),2022,61(04):660-666.
刘婉月,艾山·吾买尔,李哲,韩越,张大任;宜年.基于多亚词序列融合的神经机器翻译.中文信息学报,2021年已录用
Aishan Wumaier; Cuiyun Xu; Zaokere Kadeer; Wenqi Liu; Yingbo Wang; Xireaili Haierla; Maihemuti Maimaiti; ShengWei Tian; Alimu Saimaiti,A Neural Network-Based Approach to Chinese–Uyghur Organization Name Translation ,Information, 2020, 11(10): 1-18, EI
Wayit, Abliz; Hao, Wu; Maihemuti, Maimaiti; Jiamila, Wushouer; Kahaerjiang, Abiderexiti; Tuergen, Yibulayin; Aishan, Wumaier,A Syllable-Based Technique for Uyghur Text Compression, Information, 2020, 11(3): 0-172,EI
Jiabao Sheng; Aishan Wumaier; Zhe Li,POISE: Efficient Cross-Domain Chinese Named Entity Recognization via Transfer Learning, Symmetry, 2020, 12(10): 2-16, SCIE
Wayit, Abliz; Maihemuti, Maimaiti; Hao, Wu; Jiamila, Wushouer; Kahaerjiang, Abiderexiti; Tuergen, Yibulayin; Aishan, Wumaier,Research on Uyghur Pattern Matching Based on Syllable Features, Information, 2020, 11(5): 0-248, EI
艾山·吾买尔; 斯拉吉艾合麦提·如则麦麦提*; 西热艾力·海热拉; 刘文其;吐尔根·依布拉音; 汪烈军; 瓦依提·阿不力孜; 带标记音节的双向维汉神经机器翻译方法, 计算机工程与应用, 2021, 57(04): 161-168.
张胜刚; 艾山·吾买尔; 吐尔根·依布拉音; 买合木提·买买提; 亚词及单词深度维汉机器翻译模型对比 , 计算机工程与设计, 2019, (08): 2326-2330.
吴浩; 艾山·吾买尔; 王路路; 卡哈尔江·阿比的热西提; 吐尔根·依布拉音; 维吾尔语词向量的评测研究, 厦门大学学报(自然科学版), 2019, (02): 209-216.
张金超; 艾山·吾买尔; 买合木提·买买提; 刘群; 基于多编码器多解码器的大规模维汉神经网络机器翻译模型, 中文信息学报, 2018, (09): 20-27.
王路路; 艾山·吾买尔; 买合木提·买买提; 卡哈尔江·阿比的热西提; 吐尔根·依布拉音,基于 CRF 和半监督学习的维吾尔文命名实体识别, 中文信息学报, 2018, (11): 16-26+33
|