아이폰 Siri나 안드로이드에서 사용하는 음성 인식이 있습니다. 


서버에서 많은 처리를 하는 것으로 보입니다. 


Siri는 서버 내부적으로 울프램알파 엔진을 사용합니다. 


구글도 비슷한 것을 사용할 것으로 예상합니다. 


음성 데이터를 그대로 서버로 올릴까요 

아니면 전처리를 하여 계산에 필요한 2차 정보만을 추려서 서버로 보낼까요? 


네트워크 데이터 량을 줄이려면 전처리를 해서 보내는 것이 좋겠지만 

비교적 네트워크 속도가 빠르다면 그냥 전처리 없이 보내는 것이 더 빠를 수도 있을 것입니다. 


짧은 문장의 음성 데이터 크기가 얼마인지를 잘 모르겠지만, 


참고로, 시리 한번 사용하는데 63 kB를 사용한다고 하네요 

http://www.fnnews.com/view?ra=Sent0901m_View&corp=fnnews&arcid=111107161132&cDateYear=2011&cDateMonth=11&cDateDay=07