گردآوریبندی سریع بوت استرپینگ
چرا بوت استرپینگ واقعا کار میکند ما همیشه دادههای فراوانی برای پروژههایخود نداریم. اکثر وقت ها، ما فقط یک دسته داده نمونه داریم که به دلیل کمبود منابع برای انجام آزمایشات مکرر (مانند آزمایش A/B) با آن عمل کنیم.
خوشبختانه، ما شیوههای نمونهگیری مجدد داریم تا از هر دادهای که داریم بیشترین استفاده را بکنیم.طراحی سایت در مشهد بوت استرپینگ یک تکنیک نمونه گیری مجدد می باشد که در صورتیکه که مدل خود را فقط یکبار بر روی نمونه اصلی قرار دهیم، اطلاعات دیگری در مشت ما قرار میدهد.
در حالی که ممکن می باشد ما با «چه» و «چهگونه» پشت بوت استرپینگ آشنا باشیم، مقصود این مقاله ارائه «چرایی» بوت استرپینگ به طرزای غیر انسانی میباشد.
هدف از بوت استرپ تولید یک تخمین (مثلا میانگین نمونه x) برای پارامتر جمعیت (برای مثال، میانگین جامعه θ) براساس چندین نمونه داده بهدستآمده از نمونه اصلی است.
بوت استرپینگ با نمونهبرداری مکرر (با جایگزینی) گروه داده نمونه برای ساخت نمونههای شبیهسازی شده اجرا میگردد. هر نمونه بوت استرپ طراحی سایت شبیهسازی شده برای به حساب آوردن تخمین پارامتر استعمال می گردد و آنگاه این برآوردها ترکیب میشوند تا یک توزیع نمونهبرداری را تشکیل دهند.
بعد از آن توزیع نمونهگیری بوت استرپ به ما اجازه میدهد تا استنتاجهای آماری مانند برآورد خطای استاندارد پارامتر را بدست آوریم.
سه خودراه انداز | تصویر از تالیف کننده
عکس 2:
چرا بوت استرپینگ عمل میکند؟
شما باید تعجب فرمائید، چهگونه کار نمونهگیری مکرر از یک مجموعه داده نمونه به ما اجازه میدهد تا راجعبه آمار جمعیت استنتاج کنیم؟
در موقعیت ایدهآل، ما می خواهیم چند نمونه غیر وابسته از دنیای حقیقی و واقعی را از جمعیت حقیقی وواقعی بگیریم تا آمار جمعیت را ادراک کنیم. با این حال، ما قبلا ثابت کردهایم که این عمل ممکن است همیشه ممکن نباشد.
بدین ترتیب، ما باید با دسته دادههای نمونه اتوماتیک کنیم، که تبدیل به بهترین (و تنها) اطلاعاتی می گردد که در ارتباط جمعیت داریم.
منقی هست فرض کنیم که بیشتر نمونهها (در شرایطی که به صورت تصادفی کشیده شوند) نسبتاً شبیه جمعیتی خواهند بود که از آن منشا میگیرند. با پیش بینی این زمینه، به این مضمون میباشد که دادههای نمونه ما را میقدرت به عنوان جمعیتی در نظر گرفت که ما وانمود میکنیم جمعیت حقیقی وواقعی را آرم می دهد.
با این جمعیت تظاهر کننده میتوانیم نمونههای تصادفی چندگانه (بوت استرپ) را از آن رسم کنیم. این به گونهای است که گویی ما یک سری نمونه از جمعیت حقیقی وواقعی را به دست میآوریم.
توجه: در حقیقت، نمونه اصلی صرفا یک نمونه هست که ما از جمعیت واقعی داریم.
از آنجا که نمونهبرداری با جایگزینی مجاز است، نمونههای بوت استرپ را میقدرت به عنوان نمونههای تصادفی تولید شده زیر نحوهها و احتمالات متفاوت در حیث گرفت.
اطلاعات تودهآوریشده نمونهبرداری شده از این نمونههای بوت استرپ در نهایت به ما امداد خواهد کرد تا برآوردهای دقیقی از پارامتر جمعیت، برای مثال میانگین جمعیت، به دست آوریم.
عکس 3: تصویر از یک مقدمه به یادگیری آماری-دستکاری دوم
پس نمونهبرداری بوت استرپ چقدر موثر میباشد؟ تصویر بالا برآوردهای پارامتر (α) را از 1000 نمونه شبیهسازی شده از جمعیت حقیقی وواقعی در مقابل 1000 نمونه بوت استرپ مقایسه میکند.
قادر خواهیم بود ببینیم که نمودارهای میلهای دارای گسترههای مشابهی هستند، که نماد میدهد طریق بوت استرپ میتواند به طور موثری تغییرپذیری مربوط به برآورد پارامتر را برآورد کند.
خلاصه
در این مقاله، ما یک توضیح بی آلایش از شهود پشت بوت استرپینگ را بازرسی کردیم. امیدوارم که این نوشتن فهم و شعور بهتری از بوت استرپینگ و اینکه چرا از دید تئوری و عملی شغل میکند، به شما بدهد.
مفهوم کلیدی این می باشد که فرض می گردد نمونه مهم نماینده جمعیت باشد. با نمونهگیری مجدد این نمونه چند بار، ما یک توزیع نمونهگیری نسبتا دقیق از تخمین نمونه پارامتر جمعیت بدست میاوریم.
البته، یکسری هشدار در این زمینه وجود دارااست. مثلا، در شرایط ساده نمونهگیری از جمعیت حقیقی، ما هیچ زمان یک نمونه به اندازه آحاد جمعیت نخواهیم گرفت. با این اینک، به کار گیری از اندازه نمونه مشابه با دسته داده اساسی در بوت استرپینگ رایج میباشد.
برای جزئیات بیشتر درباره ی هشدارهای گوناگون، میتوانید این آیتم را در اینجا تحقیق کنید.