본문 바로가기

사이트 내 전체검색


 

HOME > 새소식 > 모교 소식
모교 소식

서강대학교 아트&테크놀로지학과 정다샘 교수 연구팀, 신호처리 분야 저명 국제학술지 IEEE TASLPRO 논문 게재

페이지 정보

작성자 최고관리자 작성일26-04-20 14:58 조회9회 댓글0건

본문

서강대학교 아트&테크놀로지학과 정다샘 교수 연구팀신호처리 분야 저명 국제학술지 IEEE TASLPRO 논문 게재

 

74a3479844a7dd11ece33e5391eb2398_1776664665_2328.jpg 

(좌측 상단부터 시계방향) 서강대학교 아트&테크놀로지학과 정다샘 교수, 정종민 석사조설아 석사과정, 이시훈 박사과정, 김동민 석사

 

   서강대학교(총장 심종혁) 아트&테크놀로지학과 정다샘 교수 연구팀(인공지능학과 정종민 석사, 김동민 석사, 이시훈 박사과정생, 조설아 석사과정생)이 서울대학교 소형준 박사후 연구원, 미국 Carnegie Mellon UniversityChris Donahu 교수 연구팀과 공동으로 제출한 논문이 신호처리 분야 국제 저명학술지 IEEE Transactions on Audio, Speech and Language Processing (이하 TASLPRO)에 게재되었다.

게재된 논문은 'U-MusT: A Unified Framework for Cross-modal Translation of Score Images, Symbolic Music, and Performance Audio', 연구팀은 해당 논문에서 다양한 음악적 모달리티 간의 번역 과제를 동시에 학습할 수 있는 범용 모델을 제안하였다.

 

음악은 악보 이미지, 심볼릭 악보, MIDI, 오디오 등의 다양한 모달리티로 존재하고, 이러한 모달리티 간의 번역 작업 (자동 음악 전사와 광학적 악보 인식)은 음악 정보 검색 (MIR)의 핵심 과제이다. 기존 연구들이 개별의 번역 과제에 특화된 모델을 제안하는 데에 그친 반면, 정다샘 교수 연구팀은 여러 모달리티 간의 번역 과제를 동시에 학습할 수 있는 범용 모델을 제안하였다.

 

해당 연구에서 제안된 모델은 피아노 악보 인식에 있어 현재 최저 수준의 기호 오류율을 달성하였으며, 세계 최초로 제안된 악보 이미지에서 바로 표현력 있는 연주 (expressive performance) 오디오를 중간 과정 없이 생성할 수 있는 모델이다. 더불어 연구팀은 제안된 모델의 학습을 위해 구축한 1300시간 이상의 악보 이미지-연주 오디오 짝 데이터셋을 공개하여 음악 정보 검색 연구계에 기여했다.

 

게재된 논문은 202654일부터 스페인 바르셀로나에서 열리는 신호처리 분야 세계 최대 규모 학회 ICASSP 2026에서도 발표될 예정이다.

  • 페이스북으로 보내기
  • 트위터로 보내기
  • 구글플러스로 보내기

댓글목록

등록된 댓글이 없습니다.

게시물 검색

 


COPYRIGHT 2007 THE SOGANG UNIVERSITY ALUMNI ASSOCIATION ALL RIGHTS RESERVED
서강대학교총동문회 | 대표 김광호 | 사업자등록번호 : 105-82-61502
서강동문장학회 | 대표 김광호 | 고유번호 : 105-82-04118
04107 서울시 마포구 백범로 35 아루페관 400호
02-712-4265 | alumni@sogang.ac.kr
개인정보보호정책 / 이용약관 / 총동문회 회칙 
[상단으로]
PC 버전으로 보기