메인 혁신 이제 Google AI를 통해 사용자는 휴대 전화 카메라를 사용하여 27 개 언어로 텍스트를 즉시 번역 할 수 있습니다.

이제 Google AI를 통해 사용자는 휴대 전화 카메라를 사용하여 27 개 언어로 텍스트를 즉시 번역 할 수 있습니다.

보고있는 영화는 무엇입니까?
 
(Gif : Google)

(Gif : Google)



인공 지능 덕분에 해외 여행이 그 어느 때보 다 쉬워졌습니다.

Google 번역 앱을 사용하면 사용자가 텍스트를 즉시 번역 할 수 있습니다. 앱에서 번역하려는 텍스트를 카메라로 가리 키기 만하면 인터넷 연결이나 휴대 전화 데이터 없이도 눈앞에서 원하는 언어로 실시간으로 변환되는 것을 볼 수 있습니다. 이 편리한 기능은 한동안 사용할 수 있었지만 7 개 언어와 만 호환되었습니다. 지금 , 기계 학습 덕분에 Google은 27 개 언어를 즉시 번역 할 수 있도록 앱을 업그레이드했습니다.

그래서 다음에 프라하에서 메뉴를 읽을 수 없을 때 Google의 소프트웨어 엔지니어 인 Otavio Good이 회사의 연구에 대해 글을 썼습니다. 블로그 .

Google은 또한 AI를 사용하여 음성 인식 오류를 절반으로 줄였습니다.

오늘부터 영어, 프랑스어, 독일어, 이탈리아어, 포르투갈어, 러시아어 및 스페인어 간 번역 외에도 불가리아어, 카탈로니아 어, 크로아티아어, 체코 어, 덴마크어, 네덜란드어, 필리핀어, 그리고 다음 20 개 언어를 실시간으로 번역 할 수 있습니다. 핀란드어, 헝가리어, 인도네시아어, 리투아니아어, 노르웨이어, 폴란드어, 루마니아어, 슬로바키아어, 스웨덴어, 터키어 및 우크라이나어. 텍스트가 실시간으로 번역되는 것을 보는 대신 사진을 찍으려면 총 37 개 언어가 지원됩니다.

그렇다면 Google은 사용 가능한 언어 수를 어떻게 늘릴 수 있었습니까? 처음에는 증강 현실 번역 애플리케이션이었던 Word Lens를 인수하고 머신 러닝과 컨볼 루션 신경망을 사용하여 앱의 기능을 향상 시켰습니다. 이미지 인식의 발전이 핵심이었습니다.

5 년 전, 컴퓨터에 고양이 나 개 이미지를 주면 어느 쪽인지 알 수 없었습니다. 컨볼 루션 신경망 덕분에 컴퓨터는 고양이와 개를 구별 할 수있을뿐만 아니라 다른 품종의 개도 인식 할 수 있다고 Good은 말했습니다. 예, 그들은 그 이상을 위해 좋습니다 trippy 예술 — 외국 메뉴를 번역하거나 최신 버전의 Google 번역 앱으로 서명하는 경우 이제 심층 신경망을 사용하고 있습니다.

단계적으로

먼저 , 번역은 배경 혼란을 제거하고 텍스트를 찾아야합니다. 동일한 색상의 픽셀 얼룩을 찾으면 문자인지 확인합니다. 그리고이 얼룩들이 서로 가까이있을 때 그것은 읽어야 할 연속적인 줄임을 이해합니다.

다음, 앱은 각 개별 문자가 무엇인지 인식해야합니다. 이것이 딥 러닝이 들어오는 곳입니다.

우리는 컨볼 루션 신경망을 사용하여 문자와 비 문자에 대해 훈련시켜 다른 문자가 어떻게 생겼는지 배울 수 있도록 블로그 게시물을 읽습니다.

연구원들은 깔끔한 글자뿐만 아니라 더러운 글자도 사용하여 소프트웨어를 훈련시켜야했습니다. 현실 세계의 편지는 반사, 먼지, 얼룩 및 온갖 종류의 기이함으로 인해 손상을 입었다 고 Good 씨는 썼습니다. 그래서 우리는 모든 종류의 가짜 먼지를 만들어 실제 세계의 시끄러움 (가짜 반사, 가짜 얼룩, 가짜 기이함)을 설득력있게 모방하는 문자 생성기를 만들었습니다. 일부

훈련에 사용되는 일부 더러운 편지. (사진 : 구글)








그만큼 제삼 단계는 번역을 얻기 위해 사전에서 인식 된 문자를 찾는 것입니다. 그리고 정확도에 대한 추가 시도를 위해 S가 5로 잘못 읽힌 경우 사전 조회는 근사치입니다.

마지막으로 번역 된 텍스트는 동일한 스타일로 원본 위에 렌더링됩니다.

이미 이미지에서 글자를 찾아서 읽었으므로이 작업을 수행 할 수 있으므로 정확히 어디에 있는지 알 수 있습니다. 글자를 둘러싼 색상을보고이를 사용하여 원래 글자를 지울 수 있습니다. 그런 다음 원래 전경색을 사용하여 상단에 번역을 그릴 수 있습니다.

가능한 한 효율적이고 인터넷이나 데이터 연결없이 이러한 모든 단계를 실시간으로 완료 할 수 있도록 Google 팀은 처리 할 수있는 정보의 밀도에 상한선이있는 매우 작은 신경망을 개발했습니다. 자체 학습 데이터를 생성하고 있었기 때문에 적절한 데이터를 포함하는 것이 중요했지만 추가 사항은 없어 신경망이 중요하지 않은 것에 너무 많은 정보 밀도를 사용하지 않도록했습니다. 예를 들어, 약간의 회전이 있지만 너무 많이 회전하지 않은 문자를 인식하는 방법이 있습니다.

결국 사용자는 20 개 이상의 언어를 사용할 수 있지만 빠른 속도는 동일합니다.

다음 사항도 참조 : Google의 AI 팀이 머신 러닝 연구에 대한 정보를 제공했습니다.

당신이 좋아하는 기사 :