구글이 iOS용 ‘오프라인 우선(offline-first)’ AI 받아쓰기 앱을 조용히 출시했다. 테크크런치에 따르면 구글은 월요일 iOS에서 내려받아 쓸 수 있는 새 받아쓰기 앱 ‘Google AI Edge Eloquent’를 공개했으며, 사용자는 앱에서 Gemma 기반 음성인식(ASR) 모델을 기기 내로 내려받은 뒤에도 오프라인 상태에서 받아쓰기를 시작할 수 있다. 회사는 라이브 전사 결과를 보여주고, 사용 중간의 머뭇거림 표현(예: “음”, “어”)과 같은 채움말을 걸러 텍스트를 다듬는 기능을 강조한다.
오프라인에서도 돌아가는 핵심: Edge Eloquent
Google AI Edge Eloquent는 앱을 무료로 설치할 수 있으며, 음성인식 모델을 다운로드하면 전화나 Wi‑Fi가 없어도 받아쓰기 작업을 수행할 수 있는 구조다. 사용자는 전사 결과를 실시간으로 확인할 수 있고, 발화를 일시정지하면 앱이 자동으로 채움말을 제거하고 문장을 정리해 준다고 테크크런치는 전했다.
전사 결과 하단에는 “핵심 요약(Key points)”, “격식 있게(Formal)”, “짧게(Short)”, “길게(Long)” 같은 변환 옵션이 배치돼 있어, 단순 기록을 넘어 용도에 맞게 출력 형태를 바꾸는 흐름을 지향한다. 구글은 앱 설명에서 “통상적인 받아쓰기 소프트웨어가 말의 더듬거림과 실수를 그대로 옮기는 반면, Eloquent는 사용자의 의도를 포착해 더 ‘사용 가능한’ 문장으로 만들어준다”고 소개한다.
클라우드 모드와 개인화: ‘로컬 우선’과 ‘정리 품질’의 줄다리기
이 앱은 오프라인 처리에 머무를 수도 있지만, 사용자가 원하면 클라우드 모드(cloud mode)를 켤 수 있다. 테크크런치에 따르면 클라우드 모드가 켜져 있을 때는 구글의 Gemini 기반 텍스트 정리가 사용되며, 로컬 처리 모드에서는 상대적으로 계산을 기기에서 수행하는 방식으로 작동한다. 즉, 네트워크가 불안정한 환경에서는 오프라인으로 ‘일단 받아쓰고’, 네트워크가 가능할 때는 정리 품질을 끌어올리는 구성이다.
또한 앱 설명에 따르면, 원하면 사용자의 Gmail 계정에서 키워드, 고유명사, 전문 용어(jargon)를 가져와 인식·정리에 활용할 수 있다. 사용자가 직접 ‘자주 쓰는 단어 목록’을 추가하는 기능도 제공한다. 받아쓰기 정확도는 결국 사용자 맥락(사내 용어, 프로젝트명 등)과 발화 습관에 영향을 받기 때문에, 이런 개인화 장치는 경쟁 제품 대비 체감 품질을 가르는 포인트가 될 가능성이 크다.
세션 기록과 측정 기능…‘기록 도구’로 자리잡나
Google AI Edge Eloquent는 세션별 받아쓰기 기록을 보여주고, 사용자는 전체 전사 이력을 검색할 수 있다. 테크크런치 보도에 따르면 각 세션에 대해 이전 세션에서 받아쓴 단어, 분당 단어 수(WPM), 총 발화 단어 수 같은 지표도 표시한다. 이는 음성 메모를 단순히 텍스트로 변환하는 것을 넘어, 사용자에게 “얼마나 말했는지/어떤 패턴인지”를 파악하게 해 주는 장치다.
한편, 이번 출시가 ‘조용히’ 이뤄졌다는 점도 주목된다. 테크크런치에 따르면 앱스토어 설명에는 안드로이드 버전이 곧 제공될 듯한 언급이 포함돼 있었으나, 실제 공개는 iOS에 한정돼 있다. 매체는 구글에 추가 확인을 요청했으며, 구글이 답변하면 안드로이드 연동 계획이 더 구체화될 수 있다.
경쟁 지형: 오프라인 받아쓰기 트렌드와 ‘Edge AI’의 확산
AI 기반 받아쓰기 앱은 최근 음성인식 모델 성능 개선과 함께 사용자 관심이 커지는 분야다. 테크크런치는 이번 앱이 Wispr Flow, SuperWhisper, Willow 등 유사 목적의 앱들과 경쟁 구도를 형성할 수 있다고 짚는다. 특히 “오프라인에서 바로 동작”은 개인정보 보호와 네트워크 제약(이동 중, 통신 불가 환경) 문제를 동시에 해결할 수 있어, 장기적으로는 가장 중요한 차별점이 될 수 있다.
구글은 이번 앱을 통해 로컬(Edge)에서 ASR을 수행하고, 필요할 때만 클라우드로 텍스트 정리를 보강하는 전략을 택했다. 이는 하드웨어 성능과 배터리, 모델 크기, 온디바이스 운영 방식 같은 제약 사이에서 현실적인 타협점으로 해석될 여지가 있다.
무엇을 지켜봐야 하나
향후 핵심은 두 가지다. 첫째, 구글이 테크크런치 보도처럼 안드로이드 버전과 시스템 레벨 통합(예: 기본 키보드 설정, 부유 버튼 형태의 빠른 실행)을 실제로 제공하는지 여부다. 둘째, 오프라인 모드에서의 품질이 클라우드 모드 대비 얼마나 유지되는지, 그리고 개인화(자주 쓰는 단어/ Gmail 기반 단서)가 실제 사용자 환경에서 인식·정리 정확도를 얼마나 개선하는지다.
이번 출시가 초기 실험 성격인지, 아니면 구글이 iOS 전반의 받아쓰기·키보드 경험까지 확장하려는 첫걸음인지도 관전 포인트다. 구글이 오프라인 우선 접근을 전면에 내세운 만큼, 향후 업데이트에서 모델 다운로드 크기나 속도(지연 시간), 변환 옵션의 다양성 등 사용성 지표가 어떻게 개선되는지가 곧 다음 뉴스가 될 가능성이 크다.
댓글 3
오프라인으로도 받아쓰기가 가능하다니 지하철이나 음영 지역에서도 쓸 수 있겠네요. 구글이 이런 기능을 iOS에 조용히 올리는 게 참 재미있어요.
사내 전문 용어나 자주 쓰는 단어를 등록해서 인식 정확도를 높일 수 있다는 점이 업무용으로 쓸 때 진짜 차별화 포인트가 될 것 같네요.
오프라인에서 바로 받아쓰기가 된다면 비행기 안이나 지하철 음영 구간에서도 쓸 수 있어서 실용성이 상당히 높아질 것 같네요.