Apa itu Bagging (Bootstrap Aggregation)?

Pembelajaran mesin ensemble terutama dapat dikategorikan sebagai pengantungan dan peningkatan Teknik bagging berguna untuk klasifikasi regresi dan statistik. Bagging digunakan dengan pohon keputusan, di mana secara signifikan meningkatkan kestabilan model dalam pengurangan varians dan meningkatkan ketepatan, yang menghilangkan tantangan overfitting.

Bagging

Gambar 1. Aliran Bagging (Bootstrap Aggregation). Sumber

Mengemas dalam pembelajaran mesin ensemble memerlukan beberapa model yang lemah, menggabungkan ramalan untuk memilih ramalan terbaik. Model lemah mengkhususkan pada bahagian yang berbeza dari ruang fitur, yang memungkinkan ramalan lekapan bagging datang dari setiap model untuk mencapai tujuan terbaik.

Pantas Su mmary

  • Bagging dan boosting adalah dua kaedah utama pembelajaran mesin ensemble.
  • Bagging adalah kaedah ensemble yang dapat digunakan dalam regresi dan klasifikasi.
  • Ia juga dikenali sebagai agregasi bootstrap, yang membentuk dua klasifikasi bagging.

Apa itu Bootstrapping?

Bagging terdiri daripada dua bahagian: agregasi dan bootstrap. Bootstrapping adalah kaedah pengambilan sampel, di mana sampel dipilih dari satu set, menggunakan kaedah penggantian. Algoritma pembelajaran kemudian dijalankan pada sampel yang dipilih.

Teknik bootstrapping menggunakan pensampelan dengan penggantian untuk menjadikan prosedur pemilihan benar-benar rawak. Apabila sampel dipilih tanpa penggantian, pemilihan pemboleh ubah berikutnya selalu bergantung pada pilihan sebelumnya, sehingga membuat kriteria tidak rawak.

Apa itu Agregasi?

Ramalan model mengalami penggabungan untuk menggabungkannya untuk ramalan akhir untuk mempertimbangkan semua hasil yang mungkin. Penggabungan dapat dilakukan berdasarkan jumlah hasil atau kemungkinan ramalan yang dihasilkan dari bootstrap setiap model dalam prosedur.

Apakah Kaedah Ensemble?

Kedua-dua beging dan meningkatkan membentuk teknik ensemble yang paling terkenal. Kaedah ensemble adalah platform pembelajaran mesin yang membantu pelbagai model dalam latihan melalui penggunaan algoritma pembelajaran yang sama. Kaedah ensemble adalah peserta kumpulan multi-classifier yang lebih besar.

Pelbagai pengklasifikasikan adalah sekumpulan pelbagai pelajar, berjumlah ribuan, dengan tujuan bersama yang dapat menggabungkan dan menyelesaikan masalah yang sama. Satu lagi kategori pengkelasan pelbagai adalah kaedah hibrid. Kaedah hibrid menggunakan sekumpulan pelajar, tetapi tidak seperti pengklasifikasi pelbagai, mereka boleh menggunakan kaedah pembelajaran yang berbeza.

Pembelajaran menghadapi pelbagai cabaran, seperti kesalahan yang disebabkan terutamanya oleh berat sebelah, kebisingan, dan varians. Ketepatan dan kestabilan pembelajaran mesin dijamin dengan kaedah ensemble seperti bagging dan boosting. Pelbagai kombinasi pengklasifikasi mengurangkan varians, terutama di mana pengklasifikasi tidak stabil, dan penting dalam membentangkan hasil yang lebih dipercayai daripada satu pengelasan tunggal.

Penerapan bagging atau meningkatkan memerlukan pemilihan algoritma pelajar asas terlebih dahulu. Sebagai contoh, jika seseorang memilih pokok klasifikasi, maka peningkatan dan penumpukan akan menjadi kumpulan pohon dengan ukuran yang sama dengan pilihan pengguna.

Kelebihan dan Kekurangan Bagging

Hutan acak Hutan acak Hutan acak adalah teknik yang digunakan dalam memodelkan ramalan dan analisis tingkah laku dan dibina di atas pohon keputusan. Hutan rawak yang mengandungi banyak keputusan adalah salah satu algoritma bagging yang paling popular. Bagging menawarkan kelebihan untuk membolehkan banyak pelajar lemah menggabungkan usaha untuk mengatasi satu pelajar yang kuat. Ini juga membantu dalam pengurangan varians, oleh itu menghilangkan overfitting Overfitting Overfitting adalah istilah yang digunakan dalam statistik yang merujuk pada kesalahan pemodelan yang terjadi ketika fungsi sesuai dengan sekumpulan data model tertentu dalam prosedur.

Satu kelemahan bagging adalah bahawa ia memperkenalkan hilangnya kebolehtafsiran model. Model yang dihasilkan dapat mengalami banyak bias apabila prosedur yang tepat tidak diendahkan. Walaupun kantungnya sangat tepat, harganya dapat dikira mahal dan ini mungkin akan menghalang penggunaannya dalam keadaan tertentu.

Bagging vs Meningkatkan

Teknik terbaik untuk digunakan antara mengantongi dan meningkatkan bergantung pada data yang tersedia, simulasi, dan keadaan yang ada saat itu. Variasi anggaran dikurangkan dengan ketara dengan teknik mengantongi dan meningkatkan semasa prosedur kombinasi, sehingga meningkatkan ketepatan. Oleh itu, hasil yang diperoleh menunjukkan kestabilan yang lebih tinggi daripada hasil individu.

Apabila acara menghadirkan cabaran prestasi rendah, teknik mengantongi tidak akan menghasilkan bias yang lebih baik. Walau bagaimanapun, teknik meningkatkan menghasilkan model yang disatukan dengan ralat yang lebih rendah kerana bertumpu pada pengoptimuman kelebihan dan pengurangan kekurangan dalam satu model.

Apabila cabaran dalam satu model lebih sesuai, kaedah bagging berkinerja lebih baik daripada teknik meningkatkan. Meningkatkan menghadapi cabaran menangani over-fitting kerana ia dilengkapi dengan over-fitting.

Bacaan Berkaitan

Finance menawarkan Pensijilan Pemodelan & Penilaian Kewangan (FMVA) ™ FMVA® Sertai 350,600+ pelajar yang bekerja untuk syarikat seperti Amazon, JP Morgan, dan program pensijilan Ferrari bagi mereka yang ingin mengambil kerjaya mereka ke tahap seterusnya. Untuk terus belajar dan mengembangkan asas pengetahuan anda, sila terokai sumber kewangan tambahan yang berkaitan di bawah:

  • Cluster Sampling Cluster Sampling Dalam statistik, cluster sampling adalah kaedah persampelan di mana keseluruhan populasi kajian dibahagikan kepada luaran yang homogen tetapi secara dalaman
  • Overasecidence Bias Overconfidence Bias Overconfidence bias adalah penilaian yang salah dan mengelirukan terhadap kemahiran, intelek, atau bakat kita. Ringkasnya, ini adalah kepercayaan egois bahawa kita lebih baik daripada yang sebenarnya. Ia boleh menjadi bias yang berbahaya dan sangat produktif dalam pasaran kewangan dan tingkah laku.
  • Analisis Regresi Analisis Regresi Analisis regresi adalah satu set kaedah statistik yang digunakan untuk pengiraan hubungan antara pemboleh ubah bersandar dan satu atau lebih pemboleh ubah bebas. Ia dapat digunakan untuk menilai kekuatan hubungan antara pemboleh ubah dan untuk memodelkan hubungan masa depan di antara mereka.
  • Analisis Data Siri Masa Analisis Data Siri Masa Analisis data siri masa adalah analisis set data yang berubah dalam jangka masa tertentu. Set data siri masa mencatat pemerhatian pemboleh ubah yang sama sepanjang pelbagai titik masa. Penganalisis kewangan menggunakan data siri masa seperti pergerakan harga saham, atau penjualan syarikat dari masa ke masa

Disyorkan

Adakah Crackstreams telah ditutup?
2022
Adakah pusat arahan MC selamat?
2022
Adakah Taliesin meninggalkan peranan kritikal?
2022