본문 바로가기
반응형

Spoken Language Processing33

Fairseq로 기계번역기 만들기 기계번역 소스언어를 타겟언어로 번역하는 프로그램 단순하게 data mapping 하는 문제 + 자연어는 생략과 중의성이 많아 컴퓨터가 이해하기 어렵, 표현도 많아서 훨씬 더 복잡한 문제 + 언어마다 다른 특징 기계번역은 NLP 에서 어려운 task 에 속함 예전에는 기계번역기 만들 때 많은 resource + 복잡한 규칙 + 많은 통계규칙들 다 활용하여 여러 개의 모듈들을 따로 만들어 합침 but 최근에 데이터 많아지고 + 딥러닝 등장 = 하나의 모듈에서 모든 일을 처리하는 방식으로 바뀜 예전보다는 상대적으로 쉽게 개발 가능 준비물 1 - 오픈소스 : Fairseq 기계번역을 위한 여러 오픈 소스 존재 그 중 facebook 에서 만든 fairseq WMT 라는 기계번역 대회에서 fairseq 가 활발하.. 2022. 1. 13.
음성언어의 구조 - (2) 말소리의 생성 과정 Sound 소리 공기의 입자가 있는데, 우리가 밖으로 말을 하면 wave 가 우리 앞의 공기 입자를 건드림. 내 입에서 나온 air pressure 의 변화에 따라 내 앞의 공기 입자가 변화하게 되고 그러면서 전파됨. 공기의 입자들이 계속 전달이 되면서 압력을 형성하고 그 압력의 패턴이 계속 달라짐. 계속해서 변하는 압력을 밖으로 전달해주고, 그 소리들이 고막을 두드림. 고막에는 얇은 막이 있음. 소리를 모아 놓으면 air pressure 이 고막을 진동시키고, 고막이 진동하면 막에 연결된 연골(부드러운 뼈; 추골, 침골)들이 진동함. 고막에 연결된 추골이 먼저 진동하고, 그 후 침골이 진동함. 가운데 귀 - 고막 -연골 들은 밖에서 들려오는 입력인 소리들의 압력 변화를 mechanical vibrati.. 2021. 12. 19.
음성언어의 구조 - (1) 말소리의 생성 과정 Human Speech Production Mechanism acoustic system : 말소리를 만들어내는 기관 - 조음기관 위 그림은 횡격막에서 허파, 그리고 성대까지의 그림이다. diaphragm 횡격막 : 갈비뼈 밑 부분 횡격막이 피스톤 운동을 하면서 air pressure 를 성대쪽으로 불어넣음 그 후 인강, 비강, 구강 소리통에서 소리가 울림 ex) 바이올린 & 첼로 - 모양 비슷 + 현으로 킨다는 공통점 바이올린과 첼로 각각의 나무통이 각각의 소리통 동굴 속에서 아~ 하면 소리가 울리는것처럼 sound source 에서 소리 입력이 들어오고 공기의 움직임을 자극하면 소리통 안에서 소리가 울리게 됨 울리는 패턴에 따라 바이올린, 첼로의 소리가 남 현이 달라서라기보다 소리통의 구조가 달라서 .. 2021. 12. 15.
반응형