kwantitatibong pagsusuripangangalakal ng algorithmagham ng datosanalitika
Mga Modelo ng Pamumuhunan na Overfit vs Disenyo ng Matatag na Istratehiya
Ang pagpili sa pagitan ng isang overfitted na modelo at isang matatag na disenyo ng estratehiya ang pagkakaiba sa pagitan ng isang sistemang mukhang perpekto sa papel at isa na talagang nakaligtas sa hindi mahuhulaan na kaguluhan ng totoong merkado. Habang ang overfitting ay lumilikha ng isang bitag na 'naloko ng mga randomness' sa pamamagitan ng paghabol sa makasaysayang ingay, ang matatag na disenyo ay nakatuon sa mga pangmatagalang prinsipyo at kakayahang umangkop.
Mga Naka-highlight
Ang overfitting ay mahalagang 'pag-angkop nang kurba' sa nakaraan upang magmukhang isang perpektong hinaharap.
Ang katatagan ay sinusukat sa kung gaano kahusay na nananatili ang isang estratehiya kapag nasubok ang mga pagpapalagay nito.
Kung mas kumplikado ang isang modelo, mas malamang na ito ay ma-overfitted.
Ang pagpapasimple ng isang estratehiya ay kadalasang ginagawa itong mas kumikita sa totoong mundo.
Ano ang Mga Modelo ng Pamumuhunan na Sobrang Nababagay?
Mga modelong istatistikal na masyadong iniayon sa isang partikular na nakaraang dataset, na kumukuha ng random na ingay sa halip na makabuluhang mga signal ng merkado.
Karaniwang nagpapakita ng halos perpektong performance sa mga backtest na walang drawdown.
Magsama ng napakaraming parametro para 'ipaliwanag' ang bawat makasaysayang pagbabago-bago ng presyo.
Nabibigo agad kapag nalantad sa live, out-of-sample na datos ng merkado.
Umasa sa mga kumplikadong padron ng matematika na walang anumang pinagbabatayang lohikang pang-ekonomiya.
Kadalasang resulta ng data mining kung saan sinusubukan ng mga mananaliksik ang libu-libong baryabol hanggang sa may manatiling epektibo.
Ano ang Matatag na Disenyo ng Istratehiya?
Isang pamamaraan sa pagbuo ng mga sistema ng pangangalakal na inuuna ang pagiging simple at integridad ng istruktura upang matiyak ang pagganap sa iba't ibang kondisyon ng merkado.
Gumagamit ng kaunting bilang ng mga baryabol upang maiwasan ang pagkuha ng mga anomalya sa istatistika.
Nagpapakita ng pare-parehong pagganap sa iba't ibang klase ng asset at mga timeframe.
Nakabatay sa isang malinaw at maipapaliwanag na teoryang pang-ekonomiya o pang-asal.
Napapanatili ang bisa nito kahit na bahagyang binago ang mga parameter ng input.
Binibigyang-diin ang pamamahala ng peligro at kaligtasan kaysa sa pag-maximize ng teoretikal na kita.
Talahanayang Pagkukumpara
Tampok
Mga Modelo ng Pamumuhunan na Sobrang Nababagay
Matatag na Disenyo ng Istratehiya
Pagiging kumplikado
Mataas (Labis na mga parameter)
Mababa (Matipid na disenyo)
Pagganap ng Backtest
Eksotiko, mataas na kita
Katamtaman, makatotohanang kita
Pag-aangkop sa Pamilihan
Marupok
Matatag
Pinagbabatayang Lohika
Puro istatistikal
Pang-ekonomiya/Pang-asal
Bilang ng Baryabol
Marami (10+ indicators)
Kaunti (2-4 na tagapagpahiwatig)
Mode ng Pagkabigo
Ganap na pagbagsak
Maganda ang pagkabulok
Pilosopiya ng Disenyo
Pagsasaayos ng nakaraan
Paghahanda para sa hinaharap
Detalyadong Paghahambing
Ang Ilusyon ng Katiyakan
Ang mga modelong overfitted ay kadalasang nagmumukhang isang 'banal na grail' dahil ang mga ito ay inayos upang perpektong tumugma sa mga tsart ng kasaysayan. Gayunpaman, ang pagiging perpekto na ito ay isang ilusyon lamang; ang modelo ay mahalagang kabisado ang mga sagot sa isang lumang pagsusulit sa halip na pag-aralan ang aktwal na paksa. Tinatanggap ng mga matatag na estratehiya na ang hinaharap ay magmumukhang iba mula sa nakaraan at magbubuo ng margin of error.
Sensitibidad ng Parameter
Ang isang matibay na estratehiya ay karaniwang gagana pa rin kung babaguhin mo ang 20-araw na moving average sa 22-araw, na nagpapakita na ang pangunahing ideya ay mahusay. Ang mga overfitted na modelo ay kilalang malutong; kung babaguhin mo ang isang decimal point sa kanilang mga setting, ang buong performance curve ay kadalasang nasisira, na nagpapatunay na ang sistema ay umaasa sa isang partikular na hanay ng mga maswerteng pagkakataon.
Pundasyon ng Ekonomiya vs Pagmimina ng Datos
Ang matibay na disenyo ay nagsisimula sa isang 'bakit'—tulad ng ideya na ang mga mamumuhunan ay labis na tumutugon sa masamang balita. Ang data mining ay nagsisimula sa isang 'ano'—paghahanap ng anumang kumbinasyon ng mga tagapagpahiwatig na nagkataong tumaas. Kung walang lohikal na angkla, ang isang modelo ay isa lamang maswerteng hula na malamang na mabigo sa sandaling magbago ang mga rehimen ng merkado.
Pagganap na Wala sa Sample
Ang tunay na pagsubok sa anumang sistema ay kung paano nito pinangangasiwaan ang datos na hindi pa nito nakikita noon. Ang mga modelong overfitted ay nasisira dahil na-optimize ang mga ito para sa 'ingay' ng panahon ng pagsasanay. Ang matibay na disenyo ay naglalayong sa kahusayan na 'walk-forward', ibig sabihin ay patuloy nilang nakukuha ang mas malawak na 'signal' kahit na nagbabago ang partikular na kapaligiran ng merkado.
Mga Kalamangan at Kahinaan
Mga Modelong Overfitted
Mga Bentahe
+Kahanga-hangang mga pitch deck
+Perpektong matematika sa kasaysayan
+Mataas na teoretikal na ratio ng Sharpe
+Kinukuha ang mga partikular na rehimen
Nakumpleto
−Mataas na panganib ng pagkasira
−Walang kapangyarihang manghula
−Sikolohikal na bitag
−Mabagal na pagpapatupad
Matibay na Disenyo
Mga Bentahe
+Maaasahang live na pangangalakal
+Mas madaling mag-troubleshoot
+Mas mababang gastos sa paglilipat ng tungkulin
+Madaling umangkop sa pagbabago
Nakumpleto
−Mas mababang mga resulta ng backtest
−Nangangailangan ng mas maraming pasensya
−Mas mahirap ibenta sa mga kliyente
−Hindi gaanong tumpak na pagpasok/paglabas
Mga Karaniwang Maling Akala
Alamat
Ang 100% na panalong rate sa isang backtest ay isang magandang senyales.
Katotohanan
Isa itong malaking babala. Walang tunay na estratehiya sa pangangalakal ang nananalo sa bawat pagkakataon; ang isang perpektong backtest ay halos palaging nangangahulugan na ang modelo ay partikular na nakaprograma upang maiwasan ang bawat pagkalugi sa kasaysayan, na ginagawa itong walang silbi para sa mga susunod na kaganapan.
Alamat
Natural na pinipigilan ng paggamit ng Machine Learning ang overfitting.
Katotohanan
Ang mga modernong AI at Neural Network ay mas madaling kapitan ng overfitting kaysa sa mga simpleng linear model. Kung walang mga pamamaraan tulad ng regularization o dropout, ang mga modelong ito ay napakahusay sa paghahanap ng mga pattern sa random noise.
Alamat
Ang pagdaragdag ng higit pang mga tagapagpahiwatig ay nagiging mas tumpak ang isang modelo.
Katotohanan
Sa quantitative finance, ang mas kaunti ay karaniwang mas marami. Ang bawat karagdagang indicator o filter na idinaragdag mo ay nagpapataas ng posibilidad na pinaliliit mo lang ang iyong modelo sa isang partikular na hanay ng mga makasaysayang petsa na hindi na mangyayari muli.
Alamat
Ang pagiging kumplikado ay katumbas ng pagiging sopistikado.
Katotohanan
Ang sopistikasyon sa analytics ay tungkol sa pagtukoy ng isang nananatiling katotohanan gamit ang pinakasimpleng posibleng kagamitan. Ang isang kumplikadong modelo ay kadalasang nagtatago lamang ng kakulangan ng pag-unawa sa likod ng isang pader ng matematika.
Mga Madalas Itanong
Paano ko malalaman kung ang aking estratehiya sa pangangalakal ay overfitted?
Ang pinakakaraniwang senyales ay ang 'performance cliff' kapag lumilipat mula sa iyong training data patungo sa isang walk-forward test. Kung ang iyong mga kita ay bumaba nang malaki kapag sinubukan sa isang bagong yugto ng panahon, o kung ang maliliit na pagbabago sa iyong entry criteria ay sumira sa mga resulta, malamang na tumitingin ka sa isang overfitted system. Ang isa pang indikasyon ay ang pagkakaroon ng higit sa 3 o 4 na variable para sa isang entry signal.
Ano ang problema ng 'Mga Antas ng Kalayaan'?
Ito ay tumutukoy sa ugnayan sa pagitan ng dami ng datos na mayroon ka at ng bilang ng mga panuntunan sa iyong modelo. Kung mayroon kang 100 kalakalan sa iyong kasaysayan ngunit 20 magkakaibang panuntunan ang tumutukoy sa mga ito, kakaunti lamang ang iyong 'antas ng kalayaan.' Sa katunayan, napaliit mo nang husto ang datos kaya't hindi na makabuluhan sa istatistika ang iyong mga resulta.
Bakit pinag-uusapan ng mga quant ang 'ingay' kumpara sa 'signal'?
Ang 'senyas' ay ang pinagbabatayang katotohanan o trend na siyang tunay na nagpapagalaw sa merkado, tulad ng mga pagbabago sa interest rate o kita ng kumpanya. Ang 'ingay' ay ang random at pabago-bagong paggalaw ng mga presyo na dulot ng milyun-milyong indibidwal na kalakalan. Napagkakamalan ng mga overfitted model ang ingay bilang signal, sinusubukang maghanap ng kahulugan sa kung ano ang mahalagang isang random na paglalakad.
Ang Walk-Forward Analysis ba ang pinakamahusay na paraan upang matiyak ang katatagan?
Isa ito sa mga pinakamahusay na kagamitang magagamit. Kabilang dito ang pag-optimize ng isang modelo sa isang segment ng datos at pagkatapos ay agad itong subukan sa susunod na segment. Sa pamamagitan ng paglilipat ng window na ito pasulong sa paglipas ng panahon, ginagaya mo kung paano sana aktwal na gumanap ang modelo bilang isang live trader, na mabilis na naglalantad sa overfitting.
Nangangahulugan ba ang matibay na disenyo na kailangan kong tanggapin ang mas mababang kita?
Hindi naman sa katagalan, pero tiyak na hindi gaanong kahanga-hanga ang magiging itsura ng iyong mga backtest. Ang isang robust na estratehiya ay maaaring magpakita ng 15% taunang kita na may makatotohanang pagbaba, habang ang isang overfitted ay maaaring magpakita ng 50% na walang pagbaba. Sa live trading, ang robust ay malamang na patuloy na kikita ng 15%, habang ang isang overfitted ay malamang na malugi.
Maaari ko bang gamitin ang 'Occam's Razor' sa aking analytics?
Talagang-talaga. Sa konteksto ng disenyo ng estratehiya, iminumungkahi ni Occam's Razor na ang pinakasimpleng paliwanag (o modelo) ay kadalasang ang pinakamahusay. Kung maipapaliwanag mo ang iyong trade entry sa isang pangungusap ng simpleng Ingles, mas malamang na ito ay maging matatag kaysa sa isang estratehiya na nangangailangan ng tatlong pahina ng mga pormula upang bigyang-katwiran.
Ano ang papel na ginagampanan ng simulasyon ng 'Monte Carlo' sa katatagan?
Nakakatulong ang mga pagsubok sa Monte Carlo sa pamamagitan ng pagbabago ng pagkakasunod-sunod ng iyong mga kalakalan o bahagyang pag-iiba-iba ng mga presyo. Kung ang iyong diskarte ay nakasalalay sa eksaktong pagkakasunod-sunod ng mga pangyayaring naganap noong 2023, masisira ito ng isang pagsubok sa Monte Carlo. Kung ang diskarte ay nakaligtas sa 1,000 iba't ibang random na pagbabalasa ng datos, mas malamang na ito ay maging matatag.
Paano nakakatulong ang 'Parameter Heatmapping' na maiwasan ang overfitting?
Sa pamamagitan ng paglikha ng heatmap ng mga resulta sa iba't ibang setting, maaari kang maghanap ng 'mga talampas ng katatagan.' Kung ang iyong estratehiya ay gumagana lamang sa eksaktong 14-period na setting ngunit nabigo sa 13 at 15, ang setting na iyon ay isang 'spike' at malamang na overfitted. Gusto mong makita ang isang malawak na lugar ng kakayahang kumita kung saan ang partikular na numero ay hindi gaanong mahalaga.
Maaari bang maging 'overfitted' ang isang matibay na estratehiya sa paglipas ng panahon?
Sa teknikal na aspeto, hindi, ngunit ang isang estratehiya ay maaaring magdusa mula sa 'pagbagsak ng modelo.' Nangyayari ito kapag nagbabago ang istruktura ng merkado—tulad ng isang bagong regulasyon o pagbabago sa mga oras ng kalakalan. Hindi ito labis na akma; ito ay ang nawawalang pinagbabatayan na senyales lamang. Mas madaling iakma ang mga matatag na estratehiya kapag nangyari ito dahil naiintindihan mo ang kanilang pangunahing lohika.
Kapaki-pakinabang ba ang 'Cross-Validation' para sa mga modelo ng pamumuhunan?
Oo, ito ay isang karaniwang gawain kung saan hinahati mo ang iyong datos sa maraming set at sinasanay/sinusubukan ang modelo sa iba't ibang kombinasyon. Kung mahusay ang pagganap ng modelo sa lahat ng subset, ipinahihiwatig nito na ang mga pattern na natagpuan nito ay pangkalahatan sa datos at hindi lamang partikular sa isang buwan o taon.
Hatol
Pumili ng matibay na disenyo ng estratehiya kung gusto mo ng sistemang kayang harapin ang kawalan ng katiyakan ng live trading at pangalagaan ang kapital sa pangmatagalan. Ang overfitting ay isang mapanganib na patibong na dapat iwasan ng sinumang seryosong analyst, dahil nagbibigay ito ng maling pakiramdam ng seguridad na humahantong sa malalaking pagkalugi.