اصلی نوآوری Google AI اکنون به کاربران امکان می دهد متن را به 27 زبان با دوربین های تلفن فوراً ترجمه کنند

Google AI اکنون به کاربران امکان می دهد متن را به 27 زبان با دوربین های تلفن فوراً ترجمه کنند

چه فیلمی را ببینید؟
 
(Gif: Google)

(Gif: Google)



به لطف هوش مصنوعی ، سفر به خارج از کشور هرگز ساده تر نبوده است.

برنامه Google Translate به کاربران امکان ترجمه فوری متن را می دهد. در این برنامه ، کافیست دوربین خود را به سمت نوشتاری که می خواهید ترجمه کنید قرار دهید و می بینید که دقیقاً در مقابل چشمان شما به زبان مورد نظر شما تبدیل می شود - بدون اتصال به اینترنت یا داده تلفن همراه. این ویژگی مفید مدتی است که در دسترس است ، اما فقط با هفت زبان سازگار بوده است. اکنون ، به لطف یادگیری ماشینی ، Google برنامه را برای ترجمه فوری 27 زبان ارتقا داده است.

Otavio Good ، مهندس نرم افزار در Google ، در مورد تحقیقات شرکت نوشت ، بنابراین دفعه بعدی که به پراگ رفتید و نمی توانید منویی را بخوانید ، ما به شما بازگشت خواهیم داد. وبلاگ .

گوگل همچنین با استفاده از هوش مصنوعی خطاهای تشخیص گفتار خود را به نصف کاهش داد.

از امروز ، علاوه بر ترجمه بین انگلیسی ، فرانسوی ، آلمانی ، ایتالیایی ، پرتغالی ، روسی و اسپانیایی ، 20 زبان زیر را می توان در زمان واقعی نیز ترجمه کرد: بلغاری ، کاتالان ، کرواتی ، چکی ، دانمارکی ، هلندی ، فیلیپینی ، فنلاندی ، مجارستانی ، اندونزیایی ، لیتوانیایی ، نروژی ، لهستانی ، رومانیایی ، اسلواکی ، سوئدی ، ترکی و اوکراینی. اگر ترجیح می دهید به جای تماشای ترجمه متن به صورت زنده ، یک عکس بگیرید ، در مجموع از 37 زبان پشتیبانی می شود.

بنابراین چگونه Google توانست تعداد زبانهای موجود را افزایش دهد؟ آنها ابتدا Word Lens را که قبلاً یک برنامه ترجمه واقعیت افزوده بود ، به دست آوردند و از یادگیری ماشین و شبکه های عصبی کانولوشن برای افزایش قابلیت های برنامه استفاده کردند. پیشرفت در تشخیص تصویر مهم بود.

پنج سال پیش ، اگر به رایانه یک تصویر از گربه یا سگ می دادید ، در گفتن کدام یک مشکل داشت. آقای گود گفت ، به لطف شبکه های عصبی کانولوشن ، کامپیوترها نه تنها می توانند تفاوت بین گربه ها و سگ ها را تشخیص دهند ، بلکه حتی می توانند نژادهای مختلف سگ را تشخیص دهند. بله ، آنها بیش از فقط خوب هستند هنر trippy - اگر یک منوی خارجی را ترجمه می کنید یا با آخرین نسخه برنامه ترجمه Google امضا می کنید ، اکنون از یک شبکه عصبی عمیق استفاده می کنید.

گام به گام

اولین ، ترجمه باید شلوغی پس زمینه را از بین ببرد و متن را پیدا کند. وقتی حباب هایی از پیکسل های همان رنگ را پیدا می کند ، حروف را مشخص می کند. و وقتی این حباب ها به هم نزدیک باشند ، می فهمد که یک خط مداوم برای خواندن است.

بعد، برنامه باید تشخیص دهد که هر حرف جداگانه چیست. اینجاست که یادگیری عمیق وارد می شود.

در پست وبلاگ آمده است: ما از یک شبکه عصبی کانولوشن استفاده می کنیم ، آن را در مورد حروف و غیر حروف آموزش می دهیم تا بتواند حروف مختلف را یاد بگیرد.

محققان مجبور شدند این نرم افزار را نه تنها با حروف تمیز ، بلکه حروف کثیف نیز آموزش دهند. آقای گود نوشت ، نامه های خارج شده در دنیای واقعی با انعکاس ، کثیفی ، لکه ها و انواع عجیب و غریب همراه است. بنابراین ما مولد نامه خود را ایجاد کردیم تا انواع آلودگی های جعلی را ایجاد کنیم تا متقاعد کننده سر و صدا دنیای واقعی را تقلید کنیم - بازتاب های جعلی ، لکه های جعلی ، عجیب و غریب جعلی در اطراف. برخی از

برخی از حروف کثیف که برای آموزش استفاده می شود. (عکس: گوگل)








سوم گام در جستجوی حروف شناخته شده در فرهنگ لغت برای دریافت ترجمه ها است. و برای یک تلاش اضافه شده در دقت ، جستجوی دیکشنری تقریبی است در صورتی که S به عنوان 5 به درستی خوانده نشود.

در آخر، متن ترجمه شده در بالا به همان سبک ارائه شده است.

ما می توانیم این کار را انجام دهیم زیرا حروف موجود در تصویر را قبلاً یافته و خوانده ایم ، بنابراین می دانیم که دقیقاً کجا هستند. ما می توانیم رنگهای اطراف حروف را بررسی کنیم و از آنها برای پاک کردن حروف اصلی استفاده کنیم. در پست وبلاگ آمده است ، و سپس می توانیم ترجمه را با استفاده از رنگ اصلی پیش زمینه ترسیم کنیم.

تیم گوگل برای اینکه هرچه بیشتر کارآمد باشد و اجازه دهد تمام این مراحل در زمان واقعی و بدون اتصال به اینترنت یا اتصال داده شود ، یک شبکه عصبی بسیار کوچک ایجاد کرد که دارای حد بالایی از تراکم اطلاعاتی است که از عهده آن برمی آید. از آنجا که آنها داده های آموزشی خود را تولید می کردند ، درج داده های صحیح مهم بود اما هیچ چیز اضافی دیگری وجود ندارد ، بنابراین شبکه عصبی از تراکم اطلاعاتی خود در موارد غیر مهم استفاده نمی کند. به عنوان مثال می توان به چگونگی تشخیص نامه با کمی چرخش نیاز داشت ، اما نه زیاد.

در پایان ، کاربران با 20 زبان دیگر اما همان سرعت سریع باقی می مانند.

همچنین ببینید: تیم هوش مصنوعی Google به ما کمترین میزان تحقیق در زمینه یادگیری ماشین را داد

مقالاتی که ممکن است دوست داشته باشید :