با ابزارهای «بدون کد» هوش مصنوعی پیش‌بینی کننده حمله قلبی را آزاد می‌کنیم


آه، دکمه آسان!
بزرگنمایی کنید / آه، دکمه آسان!

اوریش لاوسون | گتی ایماژ

این دومین قسمت از کاوش ما در مورد یادگیری ماشینی “بدون کد” است. در اولین مقاله خود، مجموعه مشکلات خود را ارائه دادیم و داده هایی را که برای آزمایش اینکه آیا ابزار ML بسیار خودکار طراحی شده برای تحلیلگران کسب و کار می تواند نتایج مقرون به صرفه را در نزدیکی کیفیت روش های کد فشرده تر که کمی بیشتر انسان را شامل می شود، ارائه دهد مورد بحث قرار دادیم. علم داده محوری

اگر آن مقاله را نخوانده اید، باید به عقب برگردید و حداقل آن را مرور کنید. اگر آماده هستید، بیایید بررسی کنیم که با داده‌های حمله قلبی تحت شرایط یادگیری ماشینی «عادی» (یعنی با کد فشرده‌تر) چه کار می‌کنیم و سپس همه آن را دور بریزیم و دکمه «آسان» را فشار دهیم.

همانطور که قبلاً بحث کردیم، ما در حال کار با مجموعه ای از داده های سلامت قلب هستیم که از یک مطالعه در موسسه کلینیک کلیولند و موسسه قلب و عروق مجارستان در بوداپست (و همچنین مکان های دیگری که داده های آنها را به دلایل کیفی دور انداخته ایم) به دست آمده است. تمام این داده‌ها در مخزنی که ما در GitHub ایجاد کرده‌ایم موجود است، اما شکل اصلی آن بخشی از مخزن داده‌ای است که برای پروژه‌های یادگیری ماشینی توسط دانشگاه کالیفرنیا-ایرواین نگهداری می‌شود. ما از دو نسخه از مجموعه داده استفاده می کنیم: نسخه کوچکتر و کاملتر شامل 303 پرونده بیمار از کلینیک کلیولند و یک پایگاه داده بزرگتر (597 بیمار) که داده های مؤسسه مجارستانی را در خود جای داده است اما دو نوع از داده ها را از دست داده است. مجموعه کوچکتر

حتما بخوانید:
منتقد سینما: پارسا پیروزفر به بلوغ بازیگری رسیده - تابناک

دو فیلد از دست رفته در داده‌های مجارستانی به‌طور بالقوه پیامد به‌نظر می‌رسند، اما داده‌های کلینیک کلیولند ممکن است مجموعه‌ای برای برخی از برنامه‌های کاربردی ML بسیار کوچک باشد، بنابراین ما سعی خواهیم کرد هر دوی آنها را پوشش دهیم.

طرح

با مجموعه داده های متعددی که برای آموزش و آزمایش در اختیار داشتیم، زمان شروع سنگ زنی فرا رسیده بود. اگر این کار را به روشی که دانشمندان داده معمولا انجام می دهند (و روشی که سال گذشته امتحان کردیم) انجام می دادیم، موارد زیر را انجام می دادیم:

  1. داده ها را به یک مجموعه آموزشی و یک مجموعه آزمایشی تقسیم کنید
  2. از داده های آموزشی با یک نوع الگوریتم موجود برای ایجاد مدل استفاده کنید
  3. مدل را با مجموعه تست اعتبارسنجی کنید تا صحت آن را بررسی کنید

ما می‌توانیم همه این کارها را با کدگذاری آن در یک نوت بوک Jupyter و تغییر دادن مدل انجام دهیم تا زمانی که به دقت قابل قبولی دست پیدا کنیم (مانند سال گذشته، در یک چرخه دائمی). اما در عوض، ابتدا دو رویکرد متفاوت را امتحان خواهیم کرد:

  • رویکرد “بدون کد” با استفاده از AWS SageMaker Canvas: Canvas داده ها را به عنوان یک کل می گیرد، به طور خودکار آنها را به آموزش و آزمایش تقسیم می کند و یک الگوریتم پیش بینی تولید می کند.
  • یکی دیگر از رویکردهای “بدون کد/کد” با استفاده از SageMaker Jumpstart و AutoPilot: AutoML بخش بزرگی از آنچه در پشت Canvas قرار دارد است. داده ها را ارزیابی می کند و تعدادی از انواع الگوریتم های مختلف را امتحان می کند تا بهترین را تعیین کند
حتما بخوانید:
جف بزوس طی 27 سال از سمت مدیرعاملی آمازون کنار می رود و مدیرعامل می شود

پس از انجام این کار، با استفاده از یکی از بسیاری از رویکردهای ML آزمایش شده نبردی که دانشمندان داده قبلاً با این مجموعه داده امتحان کرده اند، حرکت می کنیم، که برخی از آنها بیش از 90 درصد دقت را ادعا کرده اند.

محصول نهایی این رویکردها باید الگوریتمی باشد که بتوانیم از آن برای اجرای یک پرس و جوی پیش بینی بر اساس نقاط داده استفاده کنیم. اما خروجی واقعی نگاهی به مبادلات هر رویکرد از نظر زمان تکمیل، دقت و هزینه زمان محاسبه خواهد بود. (در آخرین آزمایش ما، خود AutoPilot عملاً کل بودجه اعتباری محاسباتی AWS ما را منفجر کرد.)


منبع: tarjome-news.ir

hacklink al hd film izle php shell indir siber güvenlik türkçe anime izle Fethiye Escort android rat duşakabin fiyatları fud crypter hack forum bayan escort - vip elit escort lyft accident lawyer garnet trade güvenilir mihtml nullednulled themesViagragercekhoca.org