← Experiment

Veřejně srozumitelný výklad založený na P1_RC_GGL: přísném testu uzavření galaktické dynamiky a slabého čočkování (v1.1)

Původní zpráva: Guanglin Tu | Verze vychází z: P1 v1.1 | Zařazení: veřejný výklad / nejde o recenzovaný článek
Související archivy: DOI zprávy 10.5281/zenodo.18526334 | DOI balíčku reprodukovatelnosti 10.5281/zenodo.18526286

Poznámky ke čtení

Toto je výklad, nikoli další akademická zpráva. Vychází z původní zprávy P1, zachovává klíčové obrázky a tabulky a u každého podstatného kroku doplňuje veřejně srozumitelné vysvětlení „co to znamená“.

Tento článek vysvětluje pouze závěry, k nimž P1 dospívá v rámci svých určených datových sad, registru parametrů a statistického protokolu: ve společném testu galaktických rotačních křivek (RC) a slabého čočkování galaxie–galaxie (GGL) zde model průměrné gravitační odezvy EFT zřetelně vede před testovaným minimálním základem DM_RAZOR.

Tento článek nečte P1 jako závěr, že „temná hmota byla vyvrácena“. P1 je pouze prvním krokem experimentů série P. Testuje jednu pozorovatelnou vrstvu v rámci EFT — „průměrný gravitační základ“ — nikoli celou teorii EFT.

I. P1 za pět minut: co tato studie vlastně testuje?


P1 lze číst jako ověřovací experiment napříč sondami. Neptá se jen na to, zda model dokáže proložit jednu datovou sadu; na tentýž auditní stůl klade dvě velmi odlišná gravitační čtení: rotační křivky (RC) odečítají dynamiku uvnitř galaktických disků, zatímco slabé čočkování galaxie–galaxie (GGL) odečítá projekční gravitační odezvu ve větších měřítkách.

Základní sdělení P1

P1 zvyšuje práh srovnání z otázky „fitne dobře jednu sondu?“ na otázku „uzavře se napříč sondami?“. Dobrý výkon při správném mapování a následný kolaps signálu po zamíchání mapování naznačují, že model mohl zachytit gravitační strukturu sdílenou RC a GGL.

Tabulka 0 | Klíčová čísla P1 a jak je číst

Metrika

Jak ji čte P1 / P1A

Srozumitelné čtení

Společný fit ΔlogL_total

Srovnání v hlavním textu: EFT je o 1155–1337 nad DM_RAZOR

Celkový rozdíl skóre napříč dvěma datovými sadami; větší hodnota znamená lepší celkové vysvětlení.

Síla uzavření ΔlogL_closure

Srovnání v hlavním textu: EFT má 172–281, zatímco DM_RAZOR má 127

Schopnost předpovědět GGL po inferenci pouze z RC; větší hodnota znamená větší sebekonzistenci napříč sondami.

Shuffle negativní kontroly

Po zamíchání RC-bin→GGL-bin klesá signál uzavření EFT na 6–23

Pokud se správná korespondence rozbije, výhoda by měla zmizet; čím více mizí, tím více se vylučují falešné signály.

Více-DM zátěžový test P1A

DM 7+1 + DM_STD, s EFT_BIN ponechaným jako komparátor

P1A se nedívá pouze na minimální DM_RAZOR; vkládá několik nízkorozměrných a auditovatelných větví DM vylepšení do téhož protokolu uzavření.

II. Proč byla P1 potřeba: kde se kosmologie galaktických měřítek zasekává


Problém galaktických měřítek zůstává obtížný proto, že potřeba „dodatečné gravitace či hmoty“ není jen jevem rotačních křivek. Mnoho pozorování ukazuje těsné spojení mezi viditelnou baryonovou hmotou v galaxiích a skutečnými dynamickými či čočkovacími čteními. Pro směr temné hmoty to znamená, že temné halo, baryonová zpětná vazba, historie vzniku galaxií a pozorovací systematiky musejí být sladěny s velkou přesností. Pro směry gravitace bez DM to znamená, že model nemůže dobře vypadat pouze na RC; musí obstát také ve slabém čočkování, populačních škálovacích vztazích a negativních kontrolách.

Právě to je motivace P1. Nevychází z tvrzení „temná hmota je špatně“ ani „EFT musí mít pravdu“. Předkládá k přezkoušení jednu testovatelnou tezi: může průměrná gravitační odezva EFT zanechat reprodukovatelný a přenositelný signál v uzavření RC→GGL napříč sondami?

Kontext externí literatury: proč okno RC+GGL záleží

McGaugh, Lelli a Schombert (2016) navrhli vztah radiálního zrychlení (RAR) a ukázali těsný vztah s malým rozptylem mezi pozorovaným zrychlením sledovaným rotačními křivkami a zrychlením předpovězeným z baryonové hmoty. Tím se vazba baryonů a gravitační odezvy stává nevyhnutelným tématem teorie galaktických měřítek.

Brouwer et al. (2021) použili slabé čočkování KiDS-1000 k rozšíření RAR na nižší zrychlení a větší poloměry a porovnali modely MOND, Verlindeho emergentní gravitace a LambdaCDM. Zároveň poznamenali, že rozdíly mezi ranými a pozdními typy galaxií, plynná hala a propojení galaxie–halo zůstávají klíčovými vysvětlujícími otázkami.

Mistele et al. (2024) dále použili slabé čočkování k odvození křivek kruhových rychlostí izolovaných galaxií a uvedli, že až do stovek kpc, a dokonce přibližně do 1 Mpc, není patrný jasný pokles, což je v souladu s BTFR. Ukazuje to, že slabé čočkování se stává důležitým externím čtením gravitační odezvy v galaktickém měřítku.

Hodnota P1 tedy nespočívá v tom, že jako první diskutuje RC a GGL společně. Spočívá v tom, že je vkládá do auditovatelného protokolu založeného na pevném mapování, registru parametrů, uzavření RC-only→GGL, negativních kontrolách typu shuffle a vícenásobných DM zátěžových testech P1A.

III. Co v P1 znamená EFT? Není to efektivní teorie pole


Zkratka EFT zde označuje Teorii Energetického Vlákna, nikoli efektivní teorii pole (Effective Field Theory) běžnou ve fyzice. V technické zprávě P1 je EFT použita velmi střídmě: nevstupuje do hry jako úplná konečná teorie, ale je nejprve stlačena do pozorovatelné, přizpůsobitelné a falzifikovatelné parametrizace „průměrné gravitační odezvy“.

Jednoduše řečeno, P1 se nesnaží probrat všechny mikroskopické zdroje dodatečné gravitace ani dokázat celý rámec EFT v jediném kroku. Klade užší a tvrdší otázku: pokud v galaktických měřítkách existuje určitá průměrná dodatečná gravitační odezva, dokáže nejprve vysvětlit RC a potom se přenést k predikci GGL?

Kterou část EFT P1 testuje?

P1 testuje „průměrný gravitační základ“: statisticky stabilní a přenositelný průměrný příspěvek.

P1 zatím neřeší „stochastický / šumový základ“: náhodné členy, rozdíly objekt od objektu ani dodatečný rozptyl, který může vznikat z mikroskopičtějších fluktuačních procesů.

P1 rovněž nediskutuje úplný mikroskopický mechanismus, abundance, doby života ani globální kosmologická omezení. Je to první krok experimentů série P, nikoli konečný verdikt.

IV. Plán série P: proč začít u „průměrného základu“?


Sérii P lze chápat jako pozorovací program zpětného vyhledávání EFT. Nepokládá na stůl všechna tvrzení najednou. Izoluje část, kterou lze nejsnáze testovat na veřejných datech. P1 začíná průměrným členem: pokud se průměrná gravitační odezva nedokáže uzavřít z RC do GGL, neexistuje pevný vstupní bod pro diskusi o složitějších šumových členech nebo mikroskopických mechanismech.

Tabulka 1 | Vrstvené zařazení série P

Vrstva

Otázka

Umístění v P1

P1

Může se průměrná gravitační odezva uzavřít z RC do GGL?

Hlavní otázka této zprávy

P1A

Pokud se strana DM posílí, zůstává závěr stabilní?

Příloha B: zátěžový test DM 7+1 + DM_STD

Budoucí práce série P

Lze to rozšířit na více dat, více sond a složitější systematiky?

Budoucí směr

Hlubší otázky

Jak spolu souvisejí průměrný člen, šumový člen a mikroskopické mechanismy?

Mimo rozsah závěrů P1

V. Jaká jsou data? Co samostatně říkají RC a GGL?


V.I. Rotační křivky (RC): rychloměr uvnitř galaktických disků

Rotační křivky zaznamenávají, jak rychle plyn a hvězdy obíhají v různých poloměrech od středu galaxie. Vyšší orbitální rychlosti znamenají větší potřebnou dostředivou sílu, a tedy silnější efektivní gravitační odezvu. P1 používá databázi SPARC; po předzpracování zahrnuje 104 galaxií, 2 295 rychlostních datových bodů a 20 RC binů.

V.II. Slabé čočkování (GGL): gravitační „váha“ ve větším měřítku

Slabé čočkování galaxie–galaxie měří, jak galaxie v popředí nepatrně ohýbají světlo galaxií v pozadí. Odpovídá projekční gravitační odezvě ve větším měřítku halo a nezávisí na plynově-dynamických detailech galaktických disků. P1 používá veřejná GGL data z KiDS-1000 / Brouwer et al. (2021): čtyři biny hvězdné hmotnosti, 15 radiálních bodů na bin, celkem 60 datových bodů, s plnou kovariancí.

V.III. Pevné mapování: proč záleží na 20 RC binech → 4 GGL biny

P1 propojuje 20 RC binů se 4 GGL biny pevným pravidlem: každý GGL bin odpovídá pěti RC binům, zprůměrovaným s vahami podle počtu galaxií. Toto mapování je pro každý model drženo pevně. Je to tvrdé omezení pro test uzavření i férové srovnání.

Proč mapování nedoladit až dodatečně?

Kdyby bylo dovoleno dodatečně vybrat, které RC biny odpovídají kterým GGL binům, mohl by model vyrobit uzavření pouhým přeskupením korespondence. P1 proto mapování 20→4 uzamyká předem a úmyslně je rozbíjí negativní kontrolou shuffle, právě aby otestovala, zda signál uzavření skutečně závisí na fyzikálně rozumné korespondenci.

VI. Modely a metody: co P1 vlastně porovnává?


VI.I. Strana EFT: nízkorozměrná průměrná gravitační odezva

Na straně EFT popisuje průměrnou gravitační odezvu nízkorozměrný člen dodatečné rychlosti. Tvar tohoto dodatečného členu řídí bezrozměrná jádrová funkce f(r/ℓ), kde ℓ je globální měřítko, zatímco amplitudy se přiřazují podle RC binu. Různá jádra kódují různé počáteční sklony, přechodové chování a dlouhodosahové chvosty, takže slouží jako zátěžové testy robustnosti.

VI.II. Strana DM: hlavní srovnání a příloha P1A se musejí číst odděleně

V hlavním srovnání je DM_RAZOR minimalizovaný a auditovatelný základ NFW: fixuje vztah c–M a nezahrnuje rozptyl mezi haly, adiabatickou kontrakci, jádro zpětné vazby, nesféricitu ani environmentální člen. Výhodou tohoto návrhu jsou kontrolované stupně volnosti a snadná reprodukovatelnost; omezením je, že nereprezentuje každý model LambdaCDM ani každý model halo temné hmoty.

Proto příloha B (P1A) proměňuje stranu DM ve standardizovaný zátěžový test. Beze změny sdíleného mapování či protokolu uzavření postupně přidává nízkorozměrné větve vylepšení, jako jsou SCAT, AC, FB, HIER_CMSCAT, CORE1P, čočkovací m a kombinovaný základ DM_STD, přičemž EFT_BIN ponechává jako komparátor. P1A je dobré číst takto: neporovnává EFT pouze s jedním minimálním DM základem; staví sadu běžných, auditovatelných DM mechanismů pod totéž „pravítko uzavření“.

Přesná formulace závěru použitá zde

Hlavní text: rodina EFT v hlavním srovnání výrazně překonává minimální DM_RAZOR.

Příloha B / P1A: napříč několika nízkorozměrnými, auditovatelnými větvemi DM vylepšení a zátěžovým testem DM_STD se některé společné DM fity zlepšují, ale síla uzavření nevymazává výhodu EFT_BIN.

Nejbezpečnější formulace je tedy tato: v rámci dat, mapování, registru parametrů a protokolu uzavření P1/P1A vykazuje průměrná gravitační odezva EFT silnější konzistenci napříč daty. Neznamená to vyloučení všech modelů temné hmoty.

VI.III. Test uzavření: nejdůležitější experimentální logika P1

1. Fitovat pouze RC a získat sadu posteriorních vzorků RC-only.

2. Nepřelaďovat na GGL; použít posterior RC přímo k predikci GGL.

3. Použít plnou kovarianci k výpočtu skóre predikce GGL logL_true při správném mapování.

4. Náhodně permutovat korespondenci RC-bin→GGL-bin a spočítat negativně-kontrolní skóre logL_perm.

5. Odečtením obou hodnot získat sílu uzavření: ΔlogL_closure = <logL_true> − <logL_perm>.

Analogie v běžném jazyce

Test uzavření připomíná opakovanou zkoušku v jiné místnosti: model se nejprve naučí pravidlo v místnosti RC a potom odpovídá v místnosti GGL. Pokud se naučil sdílené pravidlo, nikoli lokální trik, měl by obstát i ve druhé místnosti; pokud se korespondence mezi zkušebními místnostmi úmyslně zamíchá, výhoda by měla zmizet.

VI.IV. Před čtením technických tabulek: čtyři vstupní body

Tabulka 5.4 | Jak číst následující sadu širokých technických tabulek

Vstupní bod

Na co se dívat

Proč na tom záleží

Tabulka S1a

Celkové skóre společného fitu RC+GGL

Odpovídá na otázku: „Čí celkové vysvětlení je napříč oběma datovými sadami silnější?“

Tabulka S1b

Síla uzavření, shuffle, skeny robustnosti

Odpovídá na otázku: „Může se to, co bylo naučeno z RC, přenést do GGL?“

Tabulka B0

Definice několika větví DM vylepšení v P1A

Brání tomu, aby byla P1 redukována na „porovnala se jen s minimálním DM_RAZOR“.

Tabulka B1

Skórovací tabulka uzavření a společného fitu v P1A

Ověřuje, zda posílená DM maže výhodu uzavření.

Poznámka k rozvržení

Následující stránka přechází na orientaci na šířku, aby bylo možné zachovat široké tabulky z původní zprávy bez mazání sloupců nebo jejich stlačení do nečitelnosti. Hlavní text už podal srozumitelné čtení; technické tabulky na šířku jsou určeny čtenářům, kteří potřebují ověřit čísla a větve modelů.

Obrázek 0.1 | Přehled pracovního postupu testu uzavření v P1

Poznámka: horní řetězec je „test uzavření“ (fit pouze RC → použít posterior RC k predikci GGL); dolní řetězec je „společný fit“ (společně skórovat RC+GGL). Pravá strana porovnává skutečné mapování se zamíchanými mapováními a získává sílu uzavření ΔlogL.

VII. Klíčové technické tabulky: tabulky hlavní zprávy a tabulky P1A


Tabulka S1a | Hlavní metriky srovnání společného fitu (RC+GGL, Strict; převzato z původní zprávy)

Model (pracovní prostor)

Jádro W

k

Společné logL_total (nejlepší)

ΔlogL_total vůči DM

AICc

BIC

DM_RAZOR

žádné

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

žádné

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponenciální

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

Yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabulka S1b | Metriky uzavření a robustnosti (Strict; převzato z původní zprávy)

Model (pracovní prostor)

ΔlogL uzavření (true-perm)

ΔlogL po shuffle negativní kontroly

Rozsah ΔlogL při skenu σ_int

Rozsah ΔlogL při skenu R_min

Rozsah ΔlogL při skenu cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

Tabulka B0 | Definice větví DM vylepšení v P1A (převzato z přílohy B původní zprávy)

Pracovní prostor

dm_model

Nové parametry (≤1)

Fyzikální motivace (jádro)

Pravidlo implementace (auditovatelně přívětivé)

DM_RAZOR

NFW (fixní c–M, bez rozptylu)

Minimální, auditovatelný základ halo LambdaCDM; používá se jako přísný komparátor pro EFT

Sdílené mapování je pevné; přísný registr parametrů; používá se jako základ pouze pro relativní srovnání

DM_RAZOR_SCAT

NFW + rozptyl c–M (legacy)

σ_logc

Vztah c–M má rozptyl; aproximuje se jednoparametrovým lognormálním rozptylem

≤1 nový parametr; stále používá sdílené mapování; zisk uzavření je kritériem přijetí

DM_RAZOR_AC

NFW + adiabatická kontrakce (legacy)

α_AC

Baryonový pád může vyvolat adiabatickou kontrakci halo; aproximuje se jedním parametrem síly

≤1 nový parametr; mapování beze změny; uvádí změny AICc/BIC a zisk uzavření

DM_RAZOR_FB

NFW + jádro zpětné vazby (legacy)

log r_core

Zpětná vazba může ve vnitřní oblasti vytvořit jádro; aproximuje se jedním parametrem měřítka jádra

≤1 nový parametr; stejný protokol uzavření / negativní kontroly; zlepšení RC-only není jediným cílem

DM_HIER_CMSCAT

Hierarchický rozptyl c–M + prior

σ_logc (hier.)

Standardnější hierarchická formulace c_i∼logN(c(M_i), σ_logc); současně ovlivňuje společný posterior RC a GGL

Explicitní prior; latentní c_i je marginalizováno; zůstává nízkorozměrné a auditovatelné

DM_CORE1P

Jednoparametrový proxy člen jádra (inspirovaný coreNFW/DC14)

log r_core

Používá jednoparametrový proxy člen jádra pro hlavní efekt baryonové zpětné vazby a vyhýbá se vysokorozměrným detailům tvorby hvězd

Odkazuje na standardní literaturu; ≤1 nový parametr; navázáno na test uzavření

DM_RAZOR_M

NFW + nuisance kalibrace čočkovacího smyku

m_shear (GGL)

Pohlcuje klíčovou systematiku na straně slabého čočkování jako efektivní parametr a snižuje riziko, že systematika bude zaměněna za fyziku

Nuisance je explicitně započten; nesmí se zpětně promítat do RC; výsledky se posuzují hlavně podle robustnosti uzavření

DM_STD

Standardizovaný DM základ (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Vkládá tři běžné třídy námitek do stále nízkorozměrného standardizovaného základu

Společně uvádí registr parametrů a informační kritéria; uzavření je hlavní metrikou; používá se jako nejsilnější DM obranný komparátor

Tabulka B1 | Skórovací tabulka P1A (vyšší je lepší; převzato z přílohy B původní zprávy)

Modelová větev (workspace)

Δk

Nejlepší RC-only logL_RC (Δ)

Síla uzavření ΔlogL_closure (Δ)

Nejlepší společné logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Jak číst tabulku B1 (skórovací tabulka P1A)

• Δk: přidané stupně volnosti (větší hodnota znamená složitější model; složitější neznamená lepší).

• Soustřeďte se na dva sloupce: síla uzavření ΔlogL_closure(Δ) (větší znamená větší přenosovou sebekonzistenci) a nejlepší společné logL_total(Δ) (celkové skóre společného fitu).

• Hodnota (Δ) v závorce je rozdíl vůči DM_RAZOR, což usnadňuje přímé srovnání.

• Hlavní otázka této tabulky zní: pokud je DM základ „rozumně posílen“, zmizí výhoda uzavření?

• Poznámka ke čtení: DM_STD výrazně zlepšuje společné skóre, ale síla uzavření ve skutečnosti klesá; EFT_BIN si stále udržuje vyšší sílu uzavření.

Shrnutí jednou větou: v tomto nízkorozměrném a auditovatelném rozsahu DM vylepšení zlepšení společného fitu automaticky nevytváří silnější uzavření; klíčovým kritériem zůstává uzavření, tedy přenositelnost.

VIII. Jak číst hlavní výsledky?


VIII.I. Společný fit: napříč oběma datovými sadami dosahuje hlavní srovnání EFT vyššího skóre

Tabulka S1a a obrázek S4 ukazují, že při stejných datech, stejném sdíleném mapování a téměř stejné parametrické škále má rodina EFT společné ΔlogL_total o 1155–1337 výše než DM_RAZOR. Pro běžného čtenáře to znamená, že podle jednoho skórovacího pravidla kombinujícího RC a GGL dostávají modely hlavního srovnání EFT vyšší celkové skóre.

VIII.II. Test uzavření: hlavní důraz P1 leží na přenositelnosti

Vysoká síla uzavření znamená, že model dokáže odvodit parametry pouze z RC a bez dalšího nahlížení do GGL lépe předpovědět GGL. Ve zprávě P1 má EFT ΔlogL_closure = 172–281, zatímco DM_RAZOR má 127. Je to důležitější než konstatování, že „každý fit vypadá dobře“, protože to omezuje volnost modelu na druhé datové sadě.

VIII.III. Negativní kontrola: proč je „kolaps signálu“ dobrá zpráva?

Když P1 náhodně zamíchá korespondenci skupin RC-bin→GGL-bin, signál uzavření EFT klesne do rozsahu 6–23. Pro běžného čtenáře je to krok proti podvádění: kdyby výhoda uzavření pocházela jen z kódu, jednotek, volby kovariance nebo fitovací náhody, zamíchané korespondence by mohly výhodu stále vykazovat. Místo toho se výhoda zhroutí, což ukazuje, že závisí na správném mapování.

Obrázek S3 | Síla uzavření (vyšší je lepší): průměrná výhoda log-věrohodnosti pro predikci RC-only → GGL.

Jak číst tento obrázek

Tento obrázek je jádrem P1. Čím vyšší je sloupec, tím lépe se informace, kterou se model naučil z RC, přenáší do GGL.

Rodina EFT jako celek stojí nad DM_RAZOR, což ukazuje silnější uzavření napříč sondami v experimentu „nejdřív se nauč RC, potom předpověz GGL“.

Obrázek S4 | Výhoda společného fitu (vyšší je lepší): nejlepší logL_total RC+GGL vzhledem k DM_RAZOR.

Jak číst tento obrázek

Tento obrázek ukazuje celkové skóre po kombinaci RC a GGL.

Všechny varianty EFT leží výrazně nad 0, což ukazuje, že výhoda EFT v hlavním srovnání není lokálním jednobodovým efektem, ale celkovým chováním společné analýzy.

Obrázek R1 | Negativní kontrola: signál uzavření po zamíchaném seskupení prudce klesá.

Jak číst tento obrázek

Tento obrázek ukazuje, že jakmile se správný vztah binování RC↔GGL zamíchá, signál uzavření prudce klesne.

Díky tomu výsledek P1 vypadá spíše jako skutečná konzistence v mapování napříč daty než jako numerická náhoda dosažitelná libovolným mapováním.

IX. Robustnost a kontroly: jak se P1 vyhýbá tvrzení „jen to lépe fituje“?


Technická zpráva je nejzranitelnější vůči námitce, že její výhoda může plynout z konkrétního nastavení šumu, volby dat v centrální oblasti, práce s kovariancí nebo přeučení. P1 na tuto námitku odpovídá několika zátěžovými testy.

Tabulka 2 | Jak číst testy robustnosti a negativní kontroly v P1

Test

Námitka, kterou se snaží vyloučit

Jak to číst

Sken σ_int

Pokud RC obsahuje dodatečný neznámý rozptyl, zůstává závěr stabilní?

Po uvolnění chyb RC zůstává pořadí EFT i velikost výhody stabilní.

Sken R_min

Pokud centrální oblast galaxie není plně důvěryhodná, zůstává závěr stabilní?

Po oříznutí centrální oblasti si EFT stále drží kladnou výhodu.

Sken cov-shrink

Pokud je odhad kovariance GGL nejistý, zůstává závěr stabilní?

Po stažení kovariance směrem k diagonální matici není výhoda citlivá.

Ablační žebřík

Vynucuje si EFT fit zbytečnou složitostí?

Plný EFT_BIN je podle informačních kritérií nezbytný.

Predikce LOO s vynechaným binem

Vysvětluje model pouze data, která už viděl?

I po vynechání jednoho GGL binu model stále vykazuje silnou generalizaci.

Shuffle RC binů

Pochází uzavření ze skutečného mapování?

Po zamíchání seskupení uzavření klesá, což podporuje závislost na mapování.

Obrázek R2 | Rozsah ΔlogL_total při skenu σ_int (vyšší je lepší).

Jak číst tento obrázek

Testuje, zda náskok EFT zůstává po změnách nastavení vnitřního rozptylu RC.

Obrázek R3 | Rozsah ΔlogL_total při skenu R_min (vyšší je lepší).

Jak číst tento obrázek

Testuje, zda výhoda EFT zůstává stabilní po oříznutí složité centrální oblasti.

Obrázek R4 | Rozsah ΔlogL_total při skenu cov-shrink (vyšší je lepší).

Jak číst tento obrázek

Testuje, zda je pořadí citlivé na změny v práci s kovariancí slabého čočkování.

Obrázek R5 | Ablační žebřík pro EFT_BIN (AICc; nižší je lepší).

Jak číst tento obrázek

Testuje, zda je plný EFT_BIN pro vysvětlení dat nezbytný, místo aby pouze přidával parametry.

Obrázek R6 | LOO: rozdělení log-věrohodnosti pro vynechané biny.

Jak číst tento obrázek

Testuje, zda model stále dobře predikuje na neviděném GGL binu.

Obrázek R7 | Negativní kontrola: zamíchané mapování způsobí jasný pokles průměrného logL_true.

Jak číst tento obrázek

Dále z pohledu průměrného logL_true ukazuje, že uzavření závisí na správném mapování napříč daty.

X. P1A: proč záleží na více DM modelech v příloze


Tato část se neptá: „Porazila EFT pouze jeden minimální DM_RAZOR?“ Ptá se, zda se závěry z testu uzavření a společného fitu změní, když se DM základ posílí v rámci nízkorozměrného, reprodukovatelného a jasně účtovaného registru parametrů (P1A). Jinými slovy, P1A má oslabit námitku, že srovnání použilo příliš slabý DM základ, a přesunout debatu k otázce, zda se výkon uzavření stále liší při sadě auditovatelných DM vylepšení.

P1A se nesnaží vyčerpat všechny možné varianty modelování halo v LambdaCDM ani proměnit stranu DM ve vysokorozměrný, neauditovatelný fitovací stroj. Vybírá nízkorozměrná, reprodukovatelná a účetně průhledná vylepšení: rozptyl koncentrace, adiabatickou kontrakci, jádro zpětné vazby, hierarchický prior rozptylu c–M, jednoparametrový proxy-jádrový člen, nuisance kalibrace smyku ve slabém čočkování a kombinovaný základ DM_STD.

Hlavní čtení P1A

Mezi třemi legacy větvemi přináší malý čistý zisk síly uzavření pouze feedback/core; SCAT a AC čistý zisk uzavření nepřinášejí.

DM_HIER_CMSCAT, DM_RAZOR_M a DM_CORE1P mají na sílu uzavření malý vliv nebo nevykazují významný čistý zisk.

DM_STD může výrazně zlepšit společné logL, ale síla uzavření klesá, což naznačuje, že zvyšuje hlavně flexibilitu společného fitu, nikoli predikční sílu přenosu RC→GGL.

V tabulce B1 P1A si EFT_BIN stále udržuje vyšší sílu uzavření a výhodu společného fitu. Základní tvrzení P1 by se proto nemělo zjednodušovat na „porazilo jen minimální DM_RAZOR“.

Obrázek B1 | Skórovací tabulka P1A: uzavření a společné ΔlogL vzhledem k základu (vyšší je lepší).

Jak číst tento obrázek

Tento obrázek ukazuje, jak si několik větví DM vylepšení vede vzhledem k základu.

Jeho význam není „veškerá DM je vyloučena“. Ukazuje, že v nízkorozměrném a auditovatelném rozsahu DM vylepšení vybraném v P1A posílená DM nemaže výhodu uzavření EFT_BIN.

XI. Proč na experimentu P1 záleží


XI.I. Metodologický význam: dát uzavření napříč sondami před fit jedné sondy

Teorie galaktických měřítek často uvízne ve sporu, zda model dokáže proložit jednu sadu rotačních křivek. P1 laťku zvyšuje: dokážou parametry naučené z RC předpovědět slabé čočkování bez přeladění na GGL? Tím se P1 mění z fitovací soutěže na test přenosové predikce.

XI.II. Význam transparentnosti: učinit reprodukovatelný řetězec součástí výsledku

Jedním z důležitých přínosů P1 je to, že společně zveřejňuje data, tabulky a obrázky, označení běhů, negativní kontroly, balíček reprodukovatelnosti i auditní stopu. To je důležité pro příznivce i kritiky: debata se může vracet ke stejným veřejným datům, stejnému mapování, stejným skriptům a stejným metrikám, místo aby porovnávala slogany.

XI.III. Fyzikální význam: silný zátěžový test pro gravitaci bez DM

Ve směrech gravitace bez DM dokáže mnoho modelů vysvětlit část fenomenologie rotačních křivek nebo RAR. Těžším úkolem je současně projít čteními slabého čočkování a pod negativními kontrolami ukázat, že signál závisí na správném mapování. Význam P1 spočívá v tom, že vkládá průměrnou gravitační odezvu EFT do protokolu podobného externí zkoušce: RC je tréninkové pole, GGL je přenosové pole a shuffle je pole proti podvádění.

XI.IV. Je to důležitý experiment pro oblast gravitace bez DM?

Opatrně řečeno: pokud zpracování dat P1, balíček reprodukovatelnosti a protokol uzavření obstojí při externí replikaci, lze jej v rámci výzkumu gravitace bez DM / modifikované gravitace brát jako RC+GGL experiment uzavření, který stojí za vážnou pozornost. Jeho význam neleží ve větě „temná hmota byla vyvrácena“, ale v poskytnutí kritéria napříč sondami, které lze kopírovat, napadat i rozšiřovat.

Existuje už srovnatelně silný rámec predikčního uzavření RC+GGL?

Relevantní rámce a pozorovací tradice už existují: MOND/RAR velmi dobře organizuje rozsáhlý soubor jevů rotačních křivek; práce KiDS-1000 na slabě čočkovacím RAR také porovnávala MOND, Verlindeho emergentní gravitaci a modely LambdaCDM; LambdaCDM může rovněž vysvětlit některé slabě čočkovací a dynamické jevy prostřednictvím vazeb galaxie–halo, plynných hal a modelování zpětné vazby.

Přesné tvrzení P1 však není „žádný jiný rámec na světě nedokáže vysvětlit RC+GGL“. Tvrdí, že podle vlastního veřejného protokolu P1 — pevné mapování, uzavření RC-only→GGL, negativní kontrola shuffle, registr parametrů a vícenásobné DM zátěžové testy P1A — hlásí EFT silnější výkon uzavření.

Jinými slovy, část P1, která nejvíce stojí za externí testování, je konkrétní a reprodukovatelný srovnávací protokol, který navrhuje. Zda MOND/RAR, LambdaCDM/HOD, hydrodynamické simulace nebo jiné rámce modifikované gravitace dosáhnou podle téhož protokolu stejného či vyššího skóre uzavření, je velmi cenný další krok.

XII. Co může P1 uzavřít? Co uzavřít nemůže?


Tabulka 3 | Hranice závěrů P1

Může uzavřít

Podle dat RC+GGL v P1, pevného mapování a hlavního srovnávacího protokolu má rodina EFT vyšší společný fit i sílu uzavření než minimální DM_RAZOR.

Může uzavřít

V nízkorozměrném, auditovatelném rozsahu DM vylepšení P1A několik DM vylepšení nemaže výhodu uzavření EFT_BIN.

Může uzavřít

Negativní kontrola shuffle ukazuje, že signál uzavření závisí na správném mapování napříč daty, nikoli na libovolných mapováních.

Nemůže uzavřít

Nemůže uzavřít, že P1 vyvrátila všechny modely temné hmoty. P1A stále nevyčerpává nesféricitu, environmentální závislost, složité vazby galaxie–halo, vysokorozměrnou zpětnou vazbu ani úplné kosmologické simulace.

Nemůže uzavřít

Nemůže uzavřít, že celá teorie EFT byla prokázána z prvních principů. P1 testuje pouze fenomenologickou vrstvu průměrné gravitační odezvy.

Nemůže uzavřít

Nemůže uzavřít, že byly vyloučeny všechny systematiky. P1 poskytuje důkaz robustnosti pouze v rámci uvedených zátěžových testů a auditního rozsahu.

XIII. Často kladené otázky


O1: Říká se tím, že „temná hmota neexistuje“?

Ne. Závěr P1 musí být omezen na data, protokol a srovnávací modely použité v tomto článku. P1A jde za minimální základ DM_RAZOR, ale stále nereprezentuje každý možný model temné hmoty.

O2: Říká se tím, že „EFT už byla prokázána“?

Také ne. P1 testuje EFT jako parametrizovanou průměrnou gravitační odezvu a ukazuje silnější výkon v uzavření RC→GGL; mikroskopické mechanismy ani celá teorie nejsou závěrem P1.

O3: Proč neuvést významnost přímo v σ?

P1 používá jednotné skóre věrohodnosti, informační kritéria a rozdíly uzavření. ΔlogL je relativní výhoda podle stejného skórovacího pravidla; není totéž co jedna hodnota σ.

O4: Proč míchat RC-bin→GGL-bin?

Je to negativní kontrola. Skutečný signál napříč sondami by měl záviset na správném mapování. Kdyby zamíchaný případ zůstal stejně silný, naznačovalo by to spíše implementační zkreslení nebo statisticky falešný signál.

O5: Co by měla P1 udělat dál?

Rozšířit tentýž protokol na více dat, více DM kontrol, složitější systematiky a více rámců modifikované gravitace, zejména tak, aby externí týmy mohly replikovat stejnou metriku uzavření.

XIV. Malý slovník


Tabulka 4 | Malý slovník

Termín

Jednověté vysvětlení

Rotační křivka (RC)

Vztah poloměr–rychlost v galaktickém disku, používaný k odvození efektivní gravitace uvnitř disku.

Slabé čočkování (GGL)

Měří průměrné gravitační či hmotnostní rozložení kolem galaxií v popředí prostřednictvím statistického zkreslení tvarů galaxií v pozadí.

Test uzavření

Používá posterior RC k predikci GGL a porovnává jej s negativní kontrolou zamíchaného mapování.

Negativní kontrola

Záměrně rozbíjí klíčovou strukturu, aby se ověřilo, zda signál zmizí; používá se k vyloučení falešných signálů.

Halo NFW

Hustotní profil halo temné hmoty běžně používaný v modelech studené temné hmoty.

Vztah c–M

Vztah mezi koncentrací c a hmotností M halo temné hmoty; povolení rozptylu mění flexibilitu modelu.

DM_STD

V P1A standardizovaná DM větev zátěžového testu, která kombinuje několik nízkorozměrných DM vylepšení a čočkovací nuisance parametr.

ΔlogL

Rozdíl log-věrohodnosti mezi dvěma modely podle stejného skórovacího pravidla; kladné hodnoty znamenají, že první model si vede lépe.

Kovariance

Maticový popis korelací mezi datovými body; data slabého čočkování obvykle vyžadují plnou kovarianci.

XV. Doporučená trasa čtení a vstupní body pro citace


1. Nejprve si přečtěte oddíly 0–2, abyste si ujasnili otázku P1 a střídmou roli, kterou P1 přiděluje EFT.

2. Poté se podívejte na obrázky S3 a S4 a tabulky S1a/S1b, abyste porozuměli síle uzavření, společnému fitu a negativním kontrolám.

3. Pokud vás znepokojuje, že DM základ je příliš slabý, přejděte přímo k oddílu 9 a tabulce B1 / obrázku B1.

4. Pro technickou replikaci se vraťte k technické zprávě P1 v1.1, doplňku Tables & Figures a balíčku full_fit_runpack.

Hlavní vstupní body archivu

Technická zpráva P1 (publikační úroveň, Concept DOI): 10.5281/zenodo.18526334

Úplný balíček reprodukovatelnosti P1 (Concept DOI): 10.5281/zenodo.18526286

Strukturovaná znalostní báze EFT (volitelně, Concept DOI): 10.5281/zenodo.18853200

Poznámka k licenci: technická zpráva používá CC BY-NC-ND 4.0; úplný balíček reprodukovatelnosti používá CC BY 4.0 (s ohledem na technickou zprávu a záznamy archivu Zenodo).

XVI. Reference a externí kontext


McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.