طراحی سیستم تشخیص گفتاری که به اندازه انسان دقیق است

سه شنبه, ۳۱ مرداد ۱۳۹۶ - ۱۸:۱۳

"مایکروسافت" برای اولین‌بار موفق به طراحی سیستم تشخیص گفتاری شده که به اندازه یک انسان دقیق است.

به گزارش آرمان اقتصادی و به نقل از گیزمگ، محققان “مایکروسافت” طی ۲۵ سال در ساختن این سیستم یک نقطه عطف ایجاد کرده‌اند. سیستم تشخیص گفتار و مکالمه این شرکت در نهایت به میزان اشتباه تنها ۵.۱ درصد رسید و این اولین بار است که چنین سیستمی با این دقت حرفه‌ای انسانی همراه شده است.

یک سال پیش، گروه تحقیق گفتار و گفتمان “مایکروسافت” سیستم خود را برای رسیدن به میزان خطای کلمه‌ای ۵.۹ درصد بهبود بخشید.

این به طور کلی به عنوان میانگین خطای انسانی در نظر گرفته می‌شود، اما تحقیقات بیشتر محققان نشان داد که ۵.۱ درصد خطا، به درصد واقعی خطای شنیداری انسانی نزدیکتر است.

برای بیش از ۲۰ سال، مجموعه‌ای از مکالمات تلفنی ضبط شده به نام “Switchboard” مورد استفاده قرار گرفته است تا سیستم تشخیص گفتار برای دقت‌سنجی تست شود.

برای کاهش حدود ۱۲ درصدی میزان خطای سیستم نسبت به نتایج سال گذشته، این گروه تعدادی پیشرفت را در مدل‌های صوتی و زبانی مبتنی بر شبکه عصبی سیستم انجام داد.

در کنار ارتقای کلی تمام اجزای سیستم، میزان مدل واژگان سیستم از حدود ۳۰ هزار کلمه به ۱۶۵ هزار کلمه افزایش یافت.

مهمتر از همه، محققان آنچه را که “حافظه طولانی مدت و کوتاه مدت مبتنی بر محاوره” نامیده‌اند، تعویض کردند. به عبارت ساده، به این معناست که مدل جدید زبان به سیستم اجازه می‌دهد تا از کل مکالمات پیشین به عنوان سابقه در هنگام تلاش برای شناسایی دقیق عبارات خاص استفاده کند.

برای مثال، این امر به سیستم اجازه می‌دهد تا در صورت صحبت کردن در مورد ورزش، آن را به راحتی تشخیص دهد و خود را برای ترجمه و شناسایی عبارات تخصصی در مکالمات در حال انجام آماده کند.

این تیم یادآور می‌شود که در زمینه شناسایی گفتار هنوز کارهای زیادی برای انجام هست؛ چرا که این سیستم طراحی‌شده هنوز کارهای پیچیده مانند تشخیص گفتار در محیط‌های شلوغ و پر سر و صدا یا رمزگشایی سخنان با لهجه‌های غلیظ و مختلف را شامل نمی‌شود.

“ژیدونگ هوانگ”، تکنسین “مایکروسافت” می‌نویسد: علاوه بر این، ما باید کارهای زیادی را در آموزش کامپیوترها انجام دهیم که فقط گفت‌وگو را رونویسی نکنند، بلکه معنا و محتوای آنها را نیز درک کنند. حرکت از تشخیص گفتار به سمت درک گفتار، گام مهم بعدی برای فناوری تشخیص گفتار است.

سیستم‌های تشخیص گفتار “مایکروسافت” در حال حاضر در سرویس‌هایی مانند “Cortana” و “Speech Translator” استفاده می‌شود.

انتهای پیام

منبع:ایسنا

برچسب ها

سه شنبه, ۳۱ مرداد ۱۳۹۶ - ۱۸:۱۳

طراحی سیستم تشخیص گفتاری که به اندازه انسان دقیق است

تامین بیش از یک میلیارد دلار ارز برای کالاهای اساسی

شاسی‌بلند تمام الکتریکی تویوتا در راه است

رشد اعتبارات هزینه‌ای عمومی دستگاه‌های فرهنگی متناسب با مأموریت‌های آنها بوده است

تاکسی های برقی وارد شد/ افزایش ۲۰ درصدی تولید خودرو

قلک پورشه خالی شد

قیمت سکه و طلا امروز ۸ اردیبهشت؛ تداوم نزولی قیمت طلا و سکه

۳ برابر شدن سرمایه‌گذاری در مناطق آزاد/ ۲۰۰ بسته سرمایه‌گذاری فردا رونمایی می‌شود

برنامه‌های وزارت صمت در حوزه صنایع خلاق موجب جهش تولید می شود

مخبر: ایران به دنبال روابط برد – برد با دیگر کشورها است

همراه اول حامی برگزاری ششمین رویداد ایران اکسپو

هدف ما کمک به باشگاه پرسپولیس و کم شدن حاشیه های این تیم است

ارتباط شبه سوئیفت با ۱۰ کشور داریم

برات الکترونیک بهترین روش تأمین مالی غیرنقدی است

افزایش ۳۰ تا ۵۰ درصدی قیمت جهانی حبوبات/ واسطه‌ها بازار را بهم می‌ریزند

رفع مشکلات تامین زمین مرند و مراغه برای ساخت مسکن

مراسم تقدیر و معارفه مدیرعامل شرکت سرمایه‌گذاری گروه توسعه ملی انجام شد

پای پژو پارس به شورای رقابت کشیده شد

برات الکترونیک، مسیر انحراف در تسهیلات تولید را مسدود می‌کند

رئیس کل بانک مرکزی به عربستان رفت

اعلام ۱۲۰ همت فرصت سرمایه‌گذاری برای واحدهای مسکونی و تجاری

همچنین بخوانید

توافق محرمانه شرکت اماراتی با آمریکا قبل از قرارداد با مایکروسافت

رفع ۱۵۰ آسیب‌پذیری در به‌روزرسانی مایکروسافت

مایکروسافت به فروش جداگانه آفیس رضایت داد

درخواست سناتور آمریکایی برای خروج بینگ مایکروسافت از چین