안드로이드 개발자 모임 게시판
(글 수 7,987)
아이폰 Siri나 안드로이드에서 사용하는 음성 인식이 있습니다.
서버에서 많은 처리를 하는 것으로 보입니다.
Siri는 서버 내부적으로 울프램알파 엔진을 사용합니다.
구글도 비슷한 것을 사용할 것으로 예상합니다.
음성 데이터를 그대로 서버로 올릴까요
아니면 전처리를 하여 계산에 필요한 2차 정보만을 추려서 서버로 보낼까요?
네트워크 데이터 량을 줄이려면 전처리를 해서 보내는 것이 좋겠지만
비교적 네트워크 속도가 빠르다면 그냥 전처리 없이 보내는 것이 더 빠를 수도 있을 것입니다.
짧은 문장의 음성 데이터 크기가 얼마인지를 잘 모르겠지만,
참고로, 시리 한번 사용하는데 63 kB를 사용한다고 하네요
2011.11.07 20:31:18
아마 중간에 말안하는 시간은 아예 잘라버리고 보내지 않을까요? (개인적이지만 구글음성인식이 더 인식이 좋은거 같아요. 제 발음으로도 영어가 인식되니ㅋ)
2011.11.07 22:07:03
기껏해야 몇초정도 분량일텐데 통으로 보내는게 효율적이지 않을까요??
아이폰 같은 경우는 폰 내부에서 전처리를 거친다고 해도 대부분의 유저들이 비슷한 경험을 하겠지만
특히 안드로이드는 모델별 성능이 천차만별이니 사용자 경험 측면에서는 통으로 보내는게 나을 것 같아요!
전 사실 음성인식 기능을 많이 쓰지 않아서 별로 생각은 안해봤는데..
듣고보니 호기심이 생기긴 하네요ㅋㅋ



