
Adobe
اخیرا، Adobe یک ابزار پردازش صوتی رایگان مبتنی بر هوش مصنوعی منتشر کرده است که میتواند با حذف نویز پسزمینه و قویتر کردن صدا، برخی از ضبطهای صوتی با کیفیت پایین را بهبود بخشد. هنگامی که کار می کند، نتیجه مانند صدای ضبط شده در یک غرفه صدای حرفه ای با یک میکروفون با کیفیت بالا به نظر می رسد.
ابزار جدید که Enhance Speech نام دارد به عنوان بخشی از یک پروژه تحقیقاتی هوش مصنوعی به نام Project Shasta ایجاد شد. اخیرا Adobe Project Shasta را به Adobe Podcast تغییر نام داد.
استفاده از Enhance Speech رایگان است، اما نیاز به ایجاد یک حساب کاربری Adobe دارد و بهترین کار را با یک مرورگر وب دسکتاپ دارد. پس از ثبت نام، کاربران می توانند یک فایل MP3 یا WAV را تا حداکثر یک ساعت یا حجم 1 گیگابایت آپلود کنند. پس از چند دقیقه، میتوانید به نتیجه در مرورگر خود گوش دهید یا صدای پاکشده حاصل را دانلود کنید.
در آزمایشهای ما با این سرویس، Enhance Speech با صدایی که حاوی صدایی بدون تداخل یا نویز بیش از حد بود، بهترین عملکرد را داشت. به عنوان مثال، ما صدا را از میکروفون داخلی iMac از فردی که در فاصله 10 فوتی ایستاده بود، ضبط کردیم، از جمله صدای فن در نزدیکی، و صدای حاصل (پس از پردازش توسط Enhance Speech) به نظر می رسید که از نزدیک و بدون نویز ضبط شده باشد. استودیو با میکروفون حرفه ای

Adobe
چگونه کار می کند؟ Adobe هیچ جزئیاتی ارائه نکرد، اما ما گمان میکنیم که این شرکت یک مدل یادگیری عمیق را روی بسیاری (احتمالاً هزاران) ساعت صدای تمیز و پر سر و صدا آموزش داده است. سپس این مدل میتواند «یاد بگیرد» فرکانسهای صدای انسان را انتخاب کند و فاکسی را که دقیقاً با منبع مطابقت دارد ترکیب کند. این حدس و گمان است تا زمانی که Adobe جزئیات فنی بیشتری را ارائه کند و ما برای اظهار نظر با این شرکت تماس گرفته ایم.
با این حساب، برخی از نظر دهندگان هکر نیوز نتایج توهمآمیزی را گزارش کردهاند – خروجی غیرمنتظره مانند صداهای فانتومی که در آن هوش مصنوعی صدای ورودی را به اشتباه تفسیر میکند – از صدای بسیار پر سر و صدا (مانند گفتار ضبط شده در کنار آبشار) یا از منابع غیر انگلیسی زبان، که نشان می دهد که Enhance Speech چیزی بیش از یک تکنیک معمولی کاهش نویز انجام می دهد.
Enhance Speech اولین ابزاری نیست که این نوع قابلیت کاهش نویز مبتنی بر هوش مصنوعی را ارائه می دهد. به عنوان مثال، یک بسته منبع باز به نام mayavoz و یک سرویس تجاری به نام Audo Studio کاری مشابه انجام می دهند.
شایان ذکر است که Enhance Speech بخشی از یک گروه بزرگتر از ابزارهای پادکست مبتنی بر هوش مصنوعی از Adobe است، از جمله ابزار Mic Check (در حال حاضر به صورت رایگان نیز در دسترس است) و ابزار ویرایش صوتی مبتنی بر رونوشت که هنوز در مرحله دعوت است. فقط تست بتا
منبع: tarjome-news.ir