شما نمی توانید Tedlexa ، اینترنت اشیا / / خرس هوش مصنوعی کابوس های خود را مرور کنید


Tedlexa ، یک خرس عروسکی در اینترنت اشیا.
بزرگنمایی / الکسا ، چگونه می توانم چیزی ایجاد کنم که هوش مصنوعی را با یک اسباب بازی ترسناک از دهه 1980 ترکیب کند؟

بروزرسانی ، 1/2/21: آخر هفته سال نو است و کارکنان Ars هنوز از برخی از زمان لازم برای آماده سازی برای سال جدید لذت می برند (و مطمئن هستیم که بسیاری از ایمیل های CES). در حالی که این اتفاق می افتد ، ما در حال بازآفرینی برخی داستان های یکپارچهسازی با سیستمعامل Ars هستیم ، مانند این پروژه 2017 توسط Sean Gallagher ، سردبیر Ars ، که فقط با یک اسباب بازی نوستالژیک و کمی تجهیزات اینترنت اشیا نسلهای سوخت کابوس را ایجاد می کند. Tedlexa برای اولین بار در تاریخ 4 ژانویه 2017 (خطایی مستند به نوشتن) متولد شد ، و سابقه آن در زیر بدون تغییر به نظر می رسد.

50 سال می گذرد که کاپیتان کرک برای اولین بار با یک کامپیوتر نامرئی و دانای کل دستورات را بیان کرده است. پیاده روی ستاره ای و چندی نگذشته بود که دیوید بومن با پخش HAL 9000 از “دوچرخه ساخته شده برای دو نفر” به سرناد پرداخت 2001: ادیسه فضایی. اگرچه ما سالهاست که با رایانه ها و سایر دستگاههایمان صحبت می کنیم (غالباً به صورت درج ناپسند) ، اما اکنون تازه شروع به خراش سطح امکاناتی می کنیم که دستورات صوتی به نرم افزار هوش مصنوعی متصل شوند.

در این بین ، ما همیشه در مورد بازی اسباب بازی های Woody و Buzz خیال پردازی کرده ایم داستان اسباب بازی از آن خرس ترسناک هوش مصنوعی ، که همراه با هایلی جوئل اوسمنت در “استیون اسپیلبرگ” مشخص شده است هوش مصنوعی (خوب ، شاید مردم خواب نبینند که خرس عروسکی.) و از زمان وسواس فوربی ، تولیدکنندگان اسباب بازی سعی در هوشمند سازی اسباب بازی ها داشتند. آنها حتی آنها را به ابر پیوند دادند – با نتایج قابل پیش بینی متفاوت.

به طور طبیعی ، من تصمیم گرفتم که زمان آن رسیده است که کارها را جلو ببرم. من ایده ای برای اتصال هوش مصنوعی مبتنی بر گفتار و اینترنت اشیا with با یک خرس انیماتونیک داشتم – حتی بهتر است به چشمان بی روح و گاه به گاه چشمک زن تکینگی خیره شوم. خانمها و آقایان ، من به شما Tedlexa می دهم: یک مدل شکاف دار از سال 1998 از خرس انیماتونیک تدی راکسپین ، متصل به سرویس صدای الکسا آمازون.

معرفی تدلکسا ، یک دستیار شخصی برای کابوس های شبانه شما

من به هیچ وجه اولین نفری نبودم که فاصله بین اسباب بازی های انیماتریک و رابط های صوتی را برطرف کردم. برایان کین ، مدرس دانشکده طراحی رود آیلند ، دستکش را با ویدئویی از الکسا که با این نماد متحرک سروو دیگر ، بیلی بیگ باس مرتبط است ، انداخت. تمام این Frakenfish توسط آردوینو تأمین می شد.

پس از کاوش دره باورنکردنی با Bearduino ، یک پروژه هک سخت افزاری مستقر در پورتلند توسط توسعه دهنده / هنرمند مستقر در شان هاتاوی ، نمی توانم اجازه دهم که هک کین بی پاسخ بماند. با یک خرس عروسکی هک شده و یک آردوینو که قبلاً در دست داشت (به علاوه Raspberry Pi II و اسباب بازی های مختلفی که در اختیار من است) ، من هدف خود را برای ایجاد یک خرس نهایی صحبت کردم.

به حاکمان برده آینده ما: لطفا مرا ببخشید.

صدای استادش

آمازون یکی از گروه هایی از شرکت ها است که تلاش می کند دستورات صوتی را به قدرت محاسباتی بسیار زیاد ابر و اینترنت رو به رشد چیزهای (مصرف کننده) متصل کند. مایکروسافت ، اپل ، گوگل و بسیاری از مدعیان در تلاشند تا رابط های صوتی دستگاه های خود را به تعداد گسترده ای از سرویس های ابری متصل کنند ، که به نوبه خود می تواند به سیستم های اتوماسیون خانگی و سایر سیستم های “سایبریفیزیک” متصل شود.

در حالی که خدمات مایکروسافت پروژه آکسفورد عمدتا تجربی باقی مانده و Siri اپل همچنان با سخت افزارهای اپل گره خورده است ، آمازون و گوگل برای تبدیل شدن به یک سرویس صوتی در حال نبرد هستند. از آنجا که تبلیغات Amazon Echo و Google Home دارای تلویزیون کابلی و تلویزیونی غنی هستند ، هر دو شرکت شروع به باز کردن همزمان خدمات نرم افزاری مرتبط با دیگران کردند.

من به چند دلیل الکسا را ​​به عنوان نقطه شروع هبوط خود به جهنم اینترنت اشیا انتخاب کردم. یکی اینکه آمازون به توسعه دهندگان دیگر اجازه می دهد “مهارت هایی” برای الکسا بسازند که مصرف کنندگان می توانند از طریق بازار مانند برنامه های تلفن همراه انتخاب کنند. این مهارت ها نحوه تفسیر دستورات صوتی خاص توسط الکسا را ​​تعیین می کنند و می توانند بر روی پلتفرم برنامه آمازون Lambda ساخته شوند یا توسط توسعه دهندگان بر روی سرور خود میزبانی شوند. (مطمئن باشید که در آینده با مهارت کار خواهید کرد.) نکته جالب دیگر این است که آمازون در جابجایی توسعه دهندگان برای جاسازی الکسا در ابزارهای خود کاملاً تهاجمی عمل کرده است – از جمله هکرهای سخت افزاری. آمازون همچنین نسخه آزمایشی خود از مشتری الکسا را ​​برای تعدادی سیستم عامل از جمله Raspberry Pi منتشر کرده است.

AVS یا خدمات صوتی الکسا به یک رد پای محاسباتی کاربر نهایی نسبتاً کوچک نیاز دارد. تمام تشخیص صدا و سنتز پاسخ صوتی در ابر آمازون اتفاق می افتد. مشتری به سادگی به دستورات گوش می دهد ، آنها را می نویسد و آنها را به عنوان درخواست HTTP POST حمل می کند که دارای یک JavaScript Object Notation (JSON) به رابط های وب مبتنی بر AVS است. پاسخ های صوتی توسط مشتری ، به صورت فایل های صوتی برای پخش ارسال می شوند ، در یک شی JSON برگشت یافته قرار می گیرند. بعضی اوقات مانند پخش مختصر فلش AVS (و پخش مستقیم موسیقی – اما این فقط در محصولات تجاری AVS در حال حاضر موجود است) شامل پخش مستقیم صدا به یک پخش کننده صوتی محلی است.

قبل از اینکه بتوانم با الکسا روی Raspberry Pi چیزی بسازم ، مجبور شدم یک پروفایل پروژه در سایت توسعه دهنده آمازون ایجاد کنم. هنگامی که یک پروژه AVS در سایت ایجاد می کنید ، مجموعه ای از اعتبارنامه ها و کلیدهای رمزگذاری مشترک ایجاد می شود که برای پیکربندی هر نرم افزاری که برای دسترسی به سرویس استفاده می کنید استفاده می شود.

هنگامی که مشتری AVS را راه اندازی کردید ، باید از طریق صفحه وب راه اندازی شده خود با برچسب Login With Amazon (LWA) پیکربندی شود – به آن امکان دسترسی به خدمات آمازون (و بالقوه پردازش پرداخت آمازون) را می دهد. بنابراین در واقع من قصد داشتم Teddy Ruxpin را با دسترسی به کارت اعتباری خود ایجاد کنم. این موضوع برخی از تحقیقات آینده درباره امنیت اینترنت اشیا از طرف من خواهد بود.

آمازون برای شروع کار نمونه ای از سرویس گیرنده الکسا را ​​به توسعه دهندگان ارائه می دهد ، از جمله یک پیاده سازی که روی Raspbian اجرا می شود ، اجرای Raspberry Pi در لینوکس دبیان. با این حال ، سرویس نمایشی رسمی تا حد زیادی به زبان جاوا نوشته شده است. گرچه ، یا شاید به دلیل تجربه گذشته ام در جاوا ، من متمایل به ایجاد نوعی رابطه بین کد نمونه و خرس مجهز به آردوینو بودم. تا آنجا که می توانستم تعیین کنم ، من دو اقدام عملی داشتم:

  • روشی متمرکز بر سخت افزار که از جریان صوتی الکسا برای هدایت انیمیشن خرس استفاده می کند.
  • مشتری قابل دسترسی تری پیدا کنید یا متن من را بنویسید ، ترجیحاً به زبانی در دسترس مانند پایتون که می تواند آردوینو را با دستورات سریال اجرا کند.

طبیعتاً ، من به عنوان یک فرد متمرکز بر نرم افزار که قبلاً مقدار قابل توجهی کار نرم افزاری با آردوینو انجام داده ام ، مسیر سخت افزاری را انتخاب کردم. امیدوارم که با ترکیبی از جستجوی اینترنت و اشتیاق خالص بر کمبود تجربه خود در زمینه الکترونیک فائق آیم ، لحیم کاری خود را به دست آوردم.

طرح A: ورودی صدا ، خروجی سروو

برنامه من استفاده از کابل تقسیم کننده برای صدای Raspberry Pi و پخش صدا با بلندگو و آردوینو بود. سیگنال صوتی به عنوان ورودی آنالوگ از Arduino خوانده می شود و من به نوعی تغییرات حجم سیگنال را به مقادیر تبدیل می کنم ، که به نوبه خود در خروجی دیجیتال در خروس دیجیتال تبدیل می شود. ظرافت این راه حل این بود که من می توانم از خرس ربات متحرک با هر منبع صوتی استفاده کنم – در نتیجه ساعت ها سرگرم می شود.

به نظر می رسد که این رویکردی است که کین با Bass-lexa خود دنبال کرده است. در یک مکالمه تلفنی ، او ابتدا نشان داد که چگونه ماهی سخنگوی خود را به عنوان نمونه نمونه سازی سریع دانش آموزانش در RISD بیرون کشیده است. وی توضیح داد: “همه اینها انجام هرچه سریعتر این کار است تا افراد بتوانند آن را تجربه کنند.” در غیر این صورت ، شما در نهایت با یک پروژه بزرگ مواجه خواهید شد که تا زمانی که تقریباً تمام نشده باشد ، به دست مردم نمی افتد.

بنابراین ، راه حل سریع نمونه سازی کین: اتصال یک سنسور صوتی که به طور فیزیکی با کانال به آمازون اکو چسبانده شده است ، به یک آردوینو که موتورهای محرک ماهی را کنترل می کند متصل شوید.

کین یک عکس متنی از نمونه اولیه خود برای من ارسال کرد - یک سنسور صوتی و یک مدل چسبیده به بالای Amazon Echo.
بزرگنمایی / کین یک عکس متنی از نمونه اولیه خود برای من ارسال کرد – یک سنسور صوتی و یک مدل چسبیده به بالای Amazon Echo.

برایان کین

البته وقتی پروژه ام را شروع کردم هیچ یک از اینها را نمی دانستم. من همچنین دارای یک اکو یا سنسور صوتی با قیمت 4 دلار نبودم ، در عوض ، در اینترنت جستجو کردم و به دنبال راه هایی برای اتصال جک صوتی به Raspberry Pi خود در Arduino شدم.

من می دانستم که سیگنال های صوتی جریان متناوب دارند و شکل موجی را ایجاد می کنند که هدفون ها و بلندگوها را تغذیه می کند. با این حال ، پین های آنالوگ آردوینو فقط می توانند ولتاژهای مثبت DC را بخوانند ، بنابراین در تئوری ، قله هایی با مقدار منفی در امواج با مقدار صفر خوانده می شوند.

من از دستورالعملي كه به دست آوردم سروو بازو را به موقع با موسيقي منتقل كردم ، اميد كاذبي داشتم – فقط با اتصال يك مقاومت 1000 اهم به زمين كابل صدا. پس از مرور توجیهی ، حتی در حالی که جسورانه به جلو می رفتم ، کمی به سلامت عقل او شک کردم.

در حالی که من داده هایی را از کابل صوتی دیدم که از طریق کد آزمایشی که روی آردوینو اجرا می شود منتقل می شود ، اینها بیشتر صفر بودند. بنابراین ، پس از مدتی صرف بررسی سایر پروژه ها ، متوجه شدم که مقاومت سیگنال را بسیار کاهش می دهد به طوری که به سختی ثبت می شود. این اتفاق خوبی بود – ساخت یک پچ مستقیم بر اساس رویکرد ارائه شده توسط Instructionable باعث می شود 5 ولت یا بیشتر در ورودی آنالوگ آردوینو (بیش از دو برابر حداکثر) قرار گیرد.

دستیابی به رویکرد فقط آردوینو به معنای استفاده اضافی از فروشگاه الکترونیکی دیگر است. متأسفانه ، متوجه شدم که حرکت من ، Baynesville Electronics ، در آخرین مراحل پایان کار است و انبار کالا در حال اتمام است. اما من جلوتر رفتم و مجبور شدم اجزای سازنده آمپلی فایر جبران شده DC را بسازم تا سیگنال صوتی را به چیزی که می توانم با آن کار کنم تبدیل کند.

وقتی شروع به خرید اسیلوسکوپ کردم ، فهمیدم که خرس اشتباهی کردم. خوشبختانه ، یک پاسخ نرم افزاری منتظر من بود – یک پروژه GitHub به نام AlexaPi.




منبع: tarjome-news.ir

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>