سفارش تبلیغ
صبا ویژن

گردآوریبندی سریع بوت استرپینگ

چرا بوت استرپینگ واقعا کار می‌کند ما همیشه داده‌های فراوانی برای پروژه‌هایخود نداریم. اکثر وقت ها، ما فقط یک دسته داده نمونه داریم که به دلیل کمبود منابع برای انجام آزمایشات مکرر (مانند آزمایش A/B) با آن عمل کنیم.

خوشبختانه، ما شیوه‌های نمونه‌گیری مجدد داریم تا از هر داده‌ای که داریم بیش‌ترین استفاده را بکنیم.طراحی سایت در مشهد بوت استرپینگ یک تکنیک نمونه گیری مجدد می باشد که در صورتی‌که که مدل خود را فقط یکبار بر روی نمونه اصلی قرار دهیم، اطلاعات دیگری در مشت ما قرار میدهد.

در حالی که ممکن می باشد ما با «چه» و «چه‌گونه» پشت بوت استرپینگ آشنا باشیم، مقصود این مقاله ارائه «چرایی» بوت استرپینگ به طرز‌ای غیر انسانی می‌باشد.

هدف از بوت استرپ تولید یک تخمین (مثلا میانگین نمونه x) برای پارامتر جمعیت (برای مثال، میانگین جامعه θ) براساس چندین نمونه داده به‌دست‌آمده از نمونه اصلی است.

بوت استرپینگ با نمونه‌برداری مکرر (با جایگزینی) گروه داده نمونه برای ساخت نمونه‌های شبیه‌سازی شده اجرا میگردد. هر نمونه بوت استرپ طراحی سایت  شبیه‌سازی شده برای به حساب آوردن تخمین پارامتر استعمال می گردد و آنگاه این برآوردها ترکیب میشوند تا یک توزیع نمونه‌برداری را تشکیل دهند.

بعد از آن توزیع نمونه‌گیری بوت استرپ به ما اجازه می‌دهد تا استنتاج‌های آماری مانند برآورد خطای استاندارد پارامتر را بدست آوریم.

سه خودراه انداز | تصویر از تالیف کننده

عکس 2:

چرا بوت استرپینگ عمل می‌کند؟

شما باید تعجب فرمائید، چه‌گونه کار نمونه‌گیری مکرر از یک مجموعه داده نمونه به ما اجازه میدهد تا راجع‌به آمار جمعیت استنتاج کنیم؟

در موقعیت ایده‌آل، ما می خواهیم چند نمونه غیر وابسته از دنیای حقیقی و واقعی را از جمعیت حقیقی وواقعی بگیریم تا آمار جمعیت را ادراک کنیم. با این حال، ما قبلا ثابت کرده‌ایم که این عمل ممکن است همیشه ممکن نباشد.

بدین ترتیب، ما باید با دسته داده‌های نمونه اتوماتیک کنیم، که تبدیل به بهترین (و تنها) اطلاعاتی می گردد که در ارتباط جمعیت داریم.

منقی هست فرض کنیم که بیشتر نمونه‌ها (در شرایطی که به صورت تصادفی کشیده شوند) نسبتاً شبیه جمعیتی خواهند بود که از آن منشا میگیرند. با پیش بینی این زمینه، به این مضمون‌ می‌باشد که داده‌های نمونه ما را می‌قدرت به عنوان جمعیتی در نظر گرفت که ما وانمود می‌کنیم جمعیت حقیقی وواقعی را آرم می دهد.

با این جمعیت تظاهر کننده می‌توانیم نمونه‌های تصادفی چندگانه (بوت استرپ) را از آن رسم کنیم. این به گونه‌ای است که گویی ما یک سری نمونه از جمعیت حقیقی وواقعی را به دست می‌آوریم.

توجه: در حقیقت، نمونه اصلی صرفا یک نمونه هست که ما از جمعیت واقعی داریم.

از آن‌جا که نمونه‌برداری با جایگزینی مجاز است، نمونه‌های بوت استرپ را می‌قدرت به عنوان نمونه‌های تصادفی تولید شده زیر نحوه‌ها و احتمالات متفاوت در حیث گرفت.

اطلاعات توده‌آوری‌شده نمونه‌برداری شده از این نمونه‌های بوت استرپ در نهایت به ما امداد خواهد کرد تا برآوردهای دقیقی از پارامتر جمعیت، برای مثال میانگین جمعیت، به دست آوریم.

عکس 3: تصویر از یک مقدمه به یادگیری آماری-دستکاری دوم

پس نمونه‌برداری بوت استرپ چقدر موثر می‌باشد؟ تصویر بالا برآوردهای پارامتر (α) را از 1000 نمونه شبیه‌سازی شده از جمعیت حقیقی وواقعی در مقابل 1000 نمونه بوت استرپ مقایسه می‌کند.

قادر خواهیم بود ببینیم که نمودارهای میله‌ای دارای گستره‌های مشابهی هستند، که نماد می‌دهد طریق بوت استرپ میتواند به طور موثری تغییرپذیری مربوط به برآورد پارامتر را برآورد کند.

خلاصه

در این مقاله، ما یک توضیح بی آلایش از شهود پشت بوت استرپینگ را بازرسی کردیم. امیدوارم که این نوشتن فهم و شعور بهتری از بوت استرپینگ و اینکه چرا از دید تئوری و عملی شغل می‌کند، به شما بدهد.

مفهوم کلیدی این می باشد که فرض می گردد نمونه مهم نماینده جمعیت باشد. با نمونه‌گیری مجدد این نمونه چند بار، ما یک توزیع نمونه‌گیری نسبتا دقیق از تخمین نمونه پارامتر جمعیت بدست میاوریم.

البته، یک‌سری هشدار در این زمینه وجود دارااست. مثلا، در شرایط ساده نمونه‌گیری از جمعیت حقیقی، ما هیچ زمان یک نمونه به اندازه آحاد جمعیت نخواهیم گرفت. با این اینک، به کار گیری از اندازه نمونه مشابه با دسته داده اساسی در بوت استرپینگ رایج می‌باشد.

برای جزئیات بیشتر درباره ی هشدارهای گوناگون، می‌توانید این آیتم را در اینجا تحقیق کنید.