[ad_1]

آزمایش ما با عنوان AI ادامه دارد: آیا ما دستگاه را شکستیم؟

اوریش لاوسون گتی ایماژ

ما اکنون در مرحله سه پروژه یادگیری ماشین خود هستیم – یعنی بر انکار و خشم غلبه کرده ایم و اکنون به سمت مذاکره و افسردگی حرکت کرده ایم. من موظف شدم از داده های Ars Technica حاصل از آزمون های عنوان پنج ساله استفاده کنم که دو ایده را در یک آزمون A / B با یکدیگر جفت و جور می کند تا به خوانندگان اجازه دهد از کدام یک برای مقاله استفاده کنند. هدف تلاش برای ساختن یک الگوریتم یادگیری ماشین است که می تواند موفقیت یک عنوان را پیش بینی کند. و در آخرین چک من ، او طبق برنامه پیش نمی رفت.

من همچنین چند دلار صرف وقت محاسبه خدمات وب آمازون کردم تا این موضوع را بفهمم. آزمایش می تواند کمی گران باشد. (مشاوره: اگر بودجه دارید ، از حالت خلبان خودکار استفاده نکنید.)

ما چندین روش را برای تجزیه و تحلیل مجموعه 11000 عنوانی خود از 5500 تست عنوان – نیمی از برندگان ، نیمی از دست داده ها را امتحان کردیم. ابتدا کل بدنه را به عنوان یک مقدار جدا شده با ویرگول در نظر گرفتیم و “سلام سلام” (یا همانطور که در گذشته می بینم “Leeroy Jenkins”) را با ابزار خلبان خودکار در AWS ‘SageMaker Studio امتحان کردیم. این با نتیجه اعتبار 53 درصدی برگشت. با نگاهی به گذشته ، این امر چندان بد نبود ، زیرا وقتی من از مدلی استفاده کردم که مخصوص پردازش زبان طبیعی است – AWS’s BlazingText – نتیجه 49 درصد دقت ، یا حتی بدتر از پرتاب سکه بود. .

دلگرم کننده و دلسرد کننده بود که جولین سیمون ، بشارت دهنده AWS ، از نظر شانس با داده های ما مشابه بود. تجربه یک مدل جایگزین با مجموعه داده های ما در حالت طبقه بندی باینری ، فقط حدود 53 تا 54 درصد دقت را نشان داد. اکنون وقت آن رسیده است که بفهمیم چه خبر است و آیا می توانیم با چند تغییر در مدل یادگیری آن را برطرف کنیم. در غیر این صورت ، شاید زمان آن فرا رسیده باشد که رویکردی کاملاً متفاوت را در پیش بگیریم.

[ad_2]

منبع: tarjome-news.ir