← Experiment

P1_RC_GGL: Přísný test uzavření dynamiky galaxií a slabého čočkování (rotační křivky + GGL)

Rámec střední gravitace EFT vs. minimální referenční model NFW pro chladnou temnou hmotu (DM)

Autor: Guanglin Tu
E-mail: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Afiliace: EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (Čína)
Verze: v1.1 | Datum: 2026-02-14

Preprint (neprošel recenzním řízením) | Tato verze je určena pro veřejné šíření a reprodukovatelnost a nepředstavuje konečnou verzi publikovanou v časopise.

Licence: zpráva (CC BY-NC-ND 4.0); úplný reprodukční balíček (CC BY 4.0).

Publikační zpráva (Concept DOI): https://doi.org/10.5281/zenodo.18526334 Úplný reprodukční balíček (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Exekutivní shrnutí

Tato zpráva je publikační archivní edicí uloženou na Zenodu. Poskytuje integrovaný a auditovatelný řetězec pokrývající data, účetní knihu modelů, férové srovnání, testování uzavření a materiály pro reprodukovatelnost. Dodatek B (P1A) slouží jako doplněk robustnosti. Zaměřuje se na zátěžové testy s „standardnějším referenčním modelem DM + jedním klíčovým systématickým efektem čočkování“, které se používají k posouzení citlivosti hlavních závěrů na realističtější modelování DM a zacházení se systematikami čočkování.

Hlavní závěry (čtyři přímo citovatelné výroky; viz oddíl 2.4):

(1) Při fitování rotačních křivek (RC) rodina EFT významně překonává DM_RAZOR ve všech kombinacích jader/priorů; typické zlepšení je Δlog𝓛_RC ≈ 10^3 (viz tabulka S1a).
(2) V testu uzavření RC→GGL vykazuje EFT silnější přenositelnost napříč sondami: síla uzavření Δlog𝓛_closure (True−Perm) je významně vyšší než u DM_RAZOR a rozdíl je robustní vůči skenům covariance shrinkage, R_min a σ_int (viz obr. S3 a tabulka S1b).
(3) Ve společném fitu (RC+GGL) si EFT zachovává stabilní výhodu; při negativní kontrole, která naruší sdílené mapování, se tato výhoda zhroutí, což podporuje interpretaci, že „efekt střední gravitace“ pochází ze sdíleného mapování, nikoli z náhodného fitu (viz obr. S4).
(4) Bez podstatného zvýšení dimenzionality Dodatek B (P1A) zátěžově testuje stranu DM pomocí standardnějších modulů referenčního modelu DM a jednoho klíčového nuisance parametru pro systematiky čočkování. Tato rozšíření neodstraňují výhodu EFT v uzavření (viz tabulka B1 a obr. B1).

Dostupnost dat a kódu: zpráva Concept DOI 10.5281/zenodo.18526334; úplný reprodukční balíček Concept DOI 10.5281/zenodo.18526286. Tagy odpovídající Dodatku B (P1A) jsou run_tag=20260213_151233, closure_tag=20260213_161731 a joint_tag=20260213_195428.

1 Abstrakt

Provádíme reprodukovatelné kvantitativní srovnání dvou teoretických rámců za použití stejných dat a stejného statistického protokolu: modelu „korekce střední gravitace“ navrženého Teorií Energetického Vlákna (Energy Filament Theory, EFT; odlišné od běžné zkratky pro effective field theory) a referenčního modelu halo NFW pro chladnou temnou hmotu (DM_RAZOR). DM_RAZOR je záměrně zvolen jako „minimální referenční model DM“: halo NFW s pevnou relací c–M (bez rozptylu mezi jednotlivými haly), sloužící jako auditovatelná a reprodukovatelná kontrola. Je také třeba zdůraznit, že tento článek zachází s EFT jako s fenomenologickou, MOND podobnou parametrizací efektivního pole / efektivní odezvy pro testování v jednotném statistickém protokolu, nikoli jako s odvozením jejích mikroskopických prvních principů v této práci.

Data se skládají z 2 295 rychlostních datových bodů z rotačních křivek (RC) SPARC, jednotně předzpracovaných a rozdělených do binů (104 galaxií, 20 RC binů), spolu s přebytkovou povrchovou hustotou ΔΣ(R) ze slabého čočkování galaxie–galaxie (GGL) KiDS-1000 (4 biny hvězdné hmotnosti × 15 bodů R v každém binu, celkem 60 bodů, s využitím plné kovariance).

Postupně provádíme inferenci pouze z RC, test uzavření RC→GGL, inferenci pouze z GGL a společnou inferenci RC+GGL, přičemž používáme audity konzistence, aby byla každá citovaná číselná hodnota dohledatelná. Při přísné účetní knize parametrů a omezeních sdíleného mapování (DM: 20 parametrů log M200_bin; EFT: 20 parametrů log V0_bin + 1 globální log ℓ) rodina EFT ve společném fitu významně překonává DM_RAZOR: ΔlogL_total = 1155–1337 vůči DM_RAZOR. Důležitější je, že test uzavření ukazuje netriviální prediktivní sílu posterioru RC pro GGL: síla uzavření EFT je ΔlogL_closure = 172–281, vyšší než 127 u DM_RAZOR. Když je seskupení RC-bin→GGL-bin náhodně promícháno, signál uzavření se zhroutí na 6–23, což potvrzuje, že signál není statistickou náhodou ani artefaktem implementace. Napříč systematickými skeny σ_int, R_min a covariance shrinkage zůstává relativní výhoda EFT kladná a stabilní co do velikosti. Abychom reagovali na běžné obavy, že „referenční model DM je příliš slabý“ nebo že „systematiky jsou zaměňovány za fyziku“, Dodatek B (P1A) poskytuje standardnější, ale stále nízkorozměrný a auditovatelný zátěžový test referenčního modelu DM, včetně hierarchického rozptylu c–M + prioru, jednoparametrového proxy jádra, čočkovacího m a kombinovaného modelu DM_STD. Při stejném protokolu uzavření tato rozšíření neodstraňují výhodu EFT v uzavření (viz tabulka B1/obr. B1).

Klíčová slova: rotační křivky; slabé čočkování galaxie–galaxie; test uzavření; EFT; chladná temná hmota; bayesovská inference

2 Úvod a přehled výsledků

Rotační křivky (RC) a slabé čočkování galaxie–galaxie (GGL) jsou dvě komplementární gravitační sondy: RC omezuje dynamický potenciál a vztah radiálního zrychlení (RAR) v rovině disku, zatímco GGL měří projektované rozložení hmoty a gravitační odezvu na škále halo. U jakékoli kandidátní teorie není klíčovou otázkou to, zda dokáže fitovat oba datové soubory odděleně, ale zda je dokáže vysvětlit konzistentně při stejném mapování napříč daty a sdílených omezeních.

Tento článek proto bere „test uzavření“ jako svůj hlavní statistický protokol: nejprve se použije posterior pouze z RC k dopředné predikci GGL a poté se porovná s negativní kontrolou, v níž je mapování RC-bin→GGL-bin permutováno/promícháno. Tím se vyhodnocuje prediktivní přenositelnost napříč daty a vylučují se falešné signály způsobené implementačním zkreslením nebo náhodným fitováním.

Teoretické zařazení a rozsah: tento článek se nepokouší předložit mikroskopické odvození EFT (Teorie Energetického Vlákna) z prvních principů ani relativisticky úplnou formulaci. Místo toho zacházíme s EFT jako s nízkorozměrnou, MOND podobnou parametrizací efektivního pole / efektivní odezvy (popsanou jádrem f(x) a globální škálou ℓ) a testujeme její konzistenci napříč daty a prediktivní přenosovou sílu prostřednictvím testu uzavření RC→GGL pod přísnou účetní knihou parametrů.

Výzkumný program a vymezení rozsahu: tento článek je součástí probíhajícího observačního vyhledávacího programu řady P. V existujících datech na škále galaxií hledáme dva možné efektivní příspěvky pozadí: (i) „podlahu střední gravitace“ popsatelnou hrubozrnnou střední gravitační odezvou a (ii) „stochastickou/šumovou podlahu“ spojenou s fluktuacemi mikroskopických procesů. V tomto článku (P1) se zaměřujeme pouze na první z nich: bez zavádění jakékoli hypotézy o mikroskopických produkčních mechanismech používáme test uzavření RC→GGL k získání observačních indicií podlahy střední gravitace a porovnáváme ji s auditovatelným referenčním modelem DM v jednotném kontrolním protokolu. Jako heuristický fyzikální obraz platí, že pokud existují krátkožijící stupně volnosti, jejich rozpad/anihilace může převádět klidovou hmotnost na energii-hybnost nesenou jinými stupni volnosti, což na efektivní úrovni přirozeně odpovídá rozkladu na „střední příspěvek + fluktuační příspěvek“; tento článek však tento mikroskopický obraz kvantitativně nemodeluje.

Abychom předešli nadinterpretaci, vymezujeme rozsah tohoto článku následovně:
• Co tento článek dělá: při přísných omezeních účetní knihy parametrů a sdíleného mapování používá testování uzavření k měření prediktivní přenositelnosti napříč daty a provádí reprodukovatelné srovnání mezi odezvou střední gravitace EFT a referenčním modelem DM.
• Co tento článek nedělá: nerozebírá mikroskopické produkční mechanismy, abundance/doby života ani kosmologická omezení; nemodeluje stochastický člen odpovídající „šumové podlaze“.
• Co tento článek netvrdí: neusiluje o svržení temné hmoty; P1 nedává konečný verdikt o tom, zda „podlaha“ existuje, ale uvádí etapovou evidenci — že v zde zvolené robustní měřicí doméně data zvýhodňují modely zahrnující střední gravitační odezvu.

Zároveň jasně uvádíme, že DM_RAZOR představuje pouze minimální a auditovatelný referenční model NFW (pevné c–M a žádný rozptyl; bez adiabatické kontrakce, feedbackového jádra, nesféricity či environmentálních členů). Hlavní závěr hlavního textu je proto přísně omezen na toto tvrzení: při minimální základně a přísných omezeních účetní knihy parametrů/mapování vykazuje EFT silnější konzistenci napříč daty. Abychom odpověděli na běžnou otázku, zda by standardnější referenční model ΛCDM a modelování klíčových systematik čočkování podstatně změnily závěr, soustřeďujeme standardnější, ale stále nízkorozměrná a auditovatelná rozšíření DM a čočkovací nuisance parametr do Dodatku B (P1A: zátěžový test standardizace referenčního modelu DM), přičemž ponecháváme přesně stejné sdílené mapování a protokol testu uzavření jako v hlavním textu (viz tabulka B1/obr. B1).

2.1 Tab. S1a–S1b: Shrnutí klíčových metrik (Strict)

Tabulka S1a uvádí hlavní srovnávací metriky pro společný fit (RC+GGL): logL, ΔlogL, AICc a BIC. Tabulka S1b uvádí metriky testu uzavření a skenů robustnosti: uzavření, negativní kontrolu shuffle a rozsahy skenů σ_int / R_min / cov-shrink. Všechny hodnoty pocházejí z přísné hlavní souhrnné tabulky Tab_Z1_master_summary a lze je položku po položce dohledat v archivním balíčku vydání.

Tabulka S1a | Hlavní srovnávací metriky společného fitu (RC+GGL, Strict).

Model (workspace)

Jádro W

k

Společné logL_total (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabulka S1b | Metriky uzavření a robustnosti (Strict).

Model (workspace)

ΔlogL uzavření (true-perm)

ΔlogL negativní kontroly po shuffle

Rozsah ΔlogL skenu σ_int

Rozsah ΔlogL skenu R_min

Rozsah ΔlogL skenu cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Obr. S3: Síla uzavření (pouze RC → predikované GGL)

Síla uzavření je definována jako ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: na posteriorních vzorcích pouze z RC se dopředně predikuje GGL a porovnává se s negativní kontrolou, v níž je mapování RC-bin→GGL-bin permutováno.

Obr. S3 | Síla uzavření (vyšší je lepší): průměrná log-likelihood výhoda predikce RC-only → GGL.


2.3 Obr. S4: Hlavní srovnání společného fitu (RC+GGL)

Výhoda společného fitu je definována jako ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Při stejných datech, stejném mapování a téměř stejné škále parametrů dosahuje rodina EFT významně vyšší společné log-likelihood.

Obr. S4 | Výhoda společného fitu (vyšší je lepší): nejlepší logL_total pro RC+GGL relativně k DM_RAZOR.


2.4 Čtyři závěry (přímo citovatelné)

(1) V jednotné společné analýze rotačních křivek SPARC a slabého čočkování KiDS-1000 model rámce střední gravitace EFT systematicky překonává DM_RAZOR v přísném kontrolním protokolu: ΔlogL_total = 1155–1337 relativně k DM_RAZOR.

(2) Test uzavření RC→GGL ukazuje silnější prediktivní konzistenci pro EFT: ΔlogL_closure = 172–281 oproti 127 pro DM_RAZOR. Když je seskupení RC-bin→GGL-bin náhodně promícháno, signál uzavření se zhroutí na 6–23, což naznačuje, že signál závisí na správném mapování napříč daty, nikoli na náhodném fitování.

(3) Systematické skeny σ_int, R_min a covariance shrinkage nemění znaménko ani škálu tvrzení „EFT překonává DM_RAZOR“, což ukazuje, že závěr je robustní vůči běžným systematickým perturbacím.

(4) Při stejném protokolu uzavření Dodatek B (P1A) posiluje referenční model DM „standardizovaným a auditovatelným“ způsobem: zachovává tři jednoparametrová rozšíření (SCAT/AC/FB) a přidává hierarchický rozptyl c–M + prior, jednoparametrový proxy model jádra a čočkovací kalibrační parametr smyku m (a jejich kombinovaný model DM_STD). Výsledky ukazují, že pouze větev feedback/core přináší malé čisté zlepšení síly uzavření (122.21→129.45, ΔΔlogL_closure≈+7.25); ostatní rozšíření přispívají k síle uzavření nevýznamně nebo negativně. Hlavní závěr tedy nezávisí na tom, že by DM_RAZOR byl příliš slabý referenční model.

3 Data a předzpracování

Tato studie používá dva veřejné datové soubory. V rámci inženýrského pracovního postupu jsou stahování, ověření kontrolního součtu (sha256) a předzpracování dokončeny dohledatelnými skripty. Aby bylo zajištěno férové srovnání napříč modely, všechny pracovní prostory (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) sdílejí přesně stejné datové produkty a mapování binů.


3.1 Rotační křivky (RC, SPARC)

Data RC pocházejí ze souborů Rotmod_LTG databáze SPARC (175 souborů rotmod). Po předzpracování modelovací vzorek zahrnuje 104 galaxií a 2 295 datových bodů (r, V_obs), rozdělených do 20 RC binů podle hvězdné hmotnosti a souvisejících kritérií. Každý datový bod obsahuje poloměr r (kpc), pozorovanou rychlost V_obs (km/s), pozorovací chybu σ_obs a rychlosti složek plyn/disk/výduť (V_gas, V_disk, V_bul).


3.2 Slabé čočkování (GGL, KiDS-1000 / Brouwer+2021)

Data GGL používají přebytkovou povrchovou hustotu ΔΣ(R) z obr. 3 práce Brouwer et al. (2021) založené na KiDS-1000 (4 biny hvězdné hmotnosti, 15 bodů R v každém binu), spolu s poskytnutou plnou kovariancí. V inženýrském pracovním postupu je původní dlouhý kovarianční formát rekonstruován do matice 15×15 pro každý bin a audity Stage-B ověřují rozměrovou a numerickou přiměřenost.


3.3 Mapování RC-bin → GGL-bin a celková velikost vzorku

4 hmotnostní biny GGL a 20 RC binů jsou propojeny pevným mapováním: každý GGL bin odpovídá 5 RC binům a příspěvky RC binů jsou váženy počtem galaxií. Toto mapování je ve všech modelech drženo pevné a představuje hlavní omezení pro férové srovnání v testování uzavření a společném fitování. Konečný společný datový soubor obsahuje n_total = 2355 bodů (RC=2295, GGL=60).

4 Modely a statistické metody


4.1 Minimální matematická specifikace EFT a DM (auditovatelná/testovatelná)

Tento oddíl uvádí minimální matematickou specifikaci, která přímo mapuje implementaci.

(a) Model rotační křivky (RC)

Pro každý datový bod RC (r, V_obs, σ_obs) používáme superpozici složek: V_mod²(r) = V_bar²(r) + V_extra²(r). Zde V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Hlavní výsledky v tomto článku používají Υ_d = Υ_b = 0.5, v souladu s empirickými doporučeními SPARC a užitečné pro snížení zbytečných stupňů volnosti.

(b) Korekce střední gravitace EFT (EFT)

Dodatečný člen EFT je parametrizován ve formě „střední rychlosti na druhou“: V_extra²(r) = V0_bin² · f(r/ℓ). Zde V0_bin je amplitudový parametr pro každý RC bin (20 parametrů), ℓ je globální škála (1 parametr) a f(x) je bezrozměrná tvarová funkce jádra. Tvary jader porovnávané v tomto článku (žádný z nich nezavádí další spojité stupně volnosti) jsou:

Fyzická motivace (rozšířená): EFT interpretuje dodatečnou gravitační odezvu na škálách galaxií jako efektivní odezvu získanou hrubozrněním / škálovým průměrováním mikroskopičtějších působení přes konečné škály. V tomto článku nepředpokládáme žádný konkrétní mikroskopický mechanismus; místo toho používáme minimální a auditovatelnou parametrizaci pro kontrolované srovnání a testování v jednotném statistickém protokolu.

Pro intuici lze dodatečný člen zapsat ve formě zrychlení: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Když r≫ℓ, f→1 a V_extra→V0_bin, což vytváří přibližně plochý dodatečný příspěvek rychlosti ve vnější oblasti. Když r≪ℓ a f(x)≈x, lze zavést charakteristickou škálu zrychlení a0,bin≈V0_bin²/ℓ (až na O(1) faktor funkce jádra), což poskytuje MOND podobnou intuici pro přechod mezi vnitřní a vnější škálou.

Diskrétní rodinu jader použitou zde (none/exponential/yukawa/powerlaw_tail) lze chápat jako nízkorozměrné proxy pro různé „počáteční sklony / rychlosti přechodu / dalekodosahové chvosty“ (například Yukawovo stínění oproti odezvě s delším chvostem). Používají se pro zátěžové testování robustnosti, nikoli k vyčerpání modelového prostoru. Ve složce slabého čočkování konstruujeme efektivní obálkovou hmotnost a hustotu z V_avg(r) a poté je projektujeme k získání ΔΣ(R). Tuto efektivní hustotu je třeba chápat jako efektivní popis čočkovacího potenciálu za předpokladů sférické symetrie a slabopolního mapování (úplné podrobnosti jsou přesunuty do Dodatku A).

Všechny výše uvedené tvary jader splňují f(x)→1 pro x→∞ (tj. saturace V_extra²→V0²), zatímco pro x≪1 dávají lineární nebo sublineární růst: například exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Různé tvary jader proto mají pozorovatelné rozdíly v malopoloměrovém „počátečním sklonu“, rychlosti přechodu a vnějším chvostu a lze je rozlišit společnými testy RC+GGL a testy uzavření.

Predikce EFT pro slabě čočkovací ΔΣ(R) se získá inferencí obálkové hmotnosti a hustoty z V_avg(r), následovanou projekčními integrály: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr a ΔΣ(R)=Σ̄(<R)−Σ(R). Numerická implementace používá logaritmickou mřížku a ve výjimečných případech ji adaptivně zjemňuje, aby zajistila stabilitu a reprodukovatelnost.

(c) DM_RAZOR: referenční halo NFW chladné temné hmoty

Zároveň jasně uvádíme, že DM_RAZOR představuje pouze minimální, auditovatelný referenční model NFW (pevné c–M a žádný rozptyl; bez adiabatické kontrakce, feedbackového jádra, nesféricity či environmentálních členů). Aby se snížilo riziko „strawman baseline“, tento článek netvrdí, že takové efekty neexistují. Místo toho je zahrnuje v Dodatku B (P1A) jako nízkorozměrné a auditovatelné zátěžové testy, včetně hierarchického zacházení s rozptylem c–M, proxy jádra a čočkovacího nuisance parametru kalibrace smyku.


4.2 Účetní kniha modelů a férové srovnání (sdílené parametry = definice uzavření)

Počet parametrů v hlavní srovnávací sadě je: DM_RAZOR k=20; rodina EFT k=21 (dodatečný parametr je globální log ℓ). Všechny modely sdílejí stejná RC data, stejná GGL data a kovarianci, stejné mapování RC-bin→GGL-bin, stejné baryonické členy a stejné převody jednotek. Tvar jádra (none / exponential / yukawa / powerlaw_tail) je navíc diskrétní volba a nezavádí žádný dodatečný spojitý parametr, čímž brání získání výhody díky „jednomu dalšímu stupni volnosti“.


4.3 Likelihood, priory a vzorkovač

Likelihood RC je diagonální gaussovská: σ_eff² = σ_obs² + σ_int². Hlavní výsledky fixují σ_int=5 km/s a Run-5 skenuje σ_int. Likelihood GGL používá gaussovskou likelihood s plnou kovariancí pro každý bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Společný cíl je logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Priory převážně kódují fyzikálně přípustné hranice (intervalová omezení na log ℓ, log V0 a log M200); když jsou povoleny volné Υ a σ_int, používají se slabě informativní priory (podrobnosti viz implementace a konfigurace balíčku vydání).

Vzorkovač používá adaptivní blokovou Metropolisovu náhodnou procházku: každý krok aktualizuje pouze náhodný podblok parametrického prostoru, aby se zlepšila míra přijetí ve vysokých dimenzích, a velikost kroku je lehce adaptována podle okenní míry přijetí (cílová míra přijetí přibližně 0.25). Hlavní výsledky používají rychlý režim (nastavení jako n_steps=800) a každý pracovní prostor vytváří stopy, rezidua a PPC grafy pro ruční i skriptované audity.


4.4 Test uzavření a negativní kontrola (definice)

Test uzavření (Run-2) zkoumá, zda posterior pouze z RC dokáže predikovat GGL bez refitování GGL. Konkrétně dopředně generuje ΔΣ(R) pro 4 GGL biny z posteriorních vzorků pouze z RC a počítá logL_true s plnou kovariancí; poté náhodně permutuje skupinové mapování RC-bin→GGL-bin k získání logL_perm. Síla uzavření je definována jako ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Run-10 navíc náhodně přeskupuje 20 RC binů do 4×5 (shuffle) a znovu počítá uzavření, čímž testuje, jak silně signál uzavření závisí na správném mapování.

5 Hlavní výsledky a interpretace


5.1 Hlavní výsledky společného fitu (RC+GGL)

Nejlepší logL_total ze společného fitu a relativní výhoda ΔlogL_total (relativně k DM_RAZOR) jsou uvedeny v tabulce S1a a na obr. S4. V hlavní srovnávací sadě má EFT_BIN největší společnou výhodu (ΔlogL_total=1337.210), zatímco ostatní tvary jader EFT si také zachovávají významné výhody (1154.827–1294.442). Podle informačních kritérií (AICc/BIC) rodina EFT také významně překonává DM_RAZOR, což naznačuje, že výhoda není dána zkreslením počtem parametrů.

Poznámka: hlavní příspěvek k ΔlogL_total≈1337 pochází z členu RC (ΔlogL_RC≈1065 ve společném rozkladu, asi 80 %). To lze chápat jako mírné zlepšení přibližně Δχ²≈0.90 na bod napříč N=2295 datovými body RC, které se při diagonální gaussovské likelihood přirozeně akumuluje do výhody řádu 10^3. Zároveň GGL a test uzavření poskytují nezávislá omezení napříč datovými soubory a pořadí zůstává stabilní při zátěžových testech σ_int, R_min a cov-shrink (viz oddíl 6 a tabulka S1b).


5.2 Výsledky testu uzavření (pouze RC → GGL)

Klíčová veličina testu uzavření ΔlogL_closure je uvedena v tabulce S1b a na obr. S3. Rodina EFT má síly uzavření 171.977–280.513, vyšší než 126.678 u DM_RAZOR. To znamená, že bez povolení dodatečných stupňů volnosti napříč daty mají posteriorní vzorky získané EFT z RC dat silnější přenositelnou prediktivní sílu pro GGL data.

Negativní kontrola dále podporuje fyzikální relevanci signálu uzavření: když je seskupení RC-bin→GGL-bin náhodně promícháno, síla uzavření EFT klesne na 6–15 (s malými rozdíly mezi jádry), zatímco základní síla uzavření dosahuje 172–281. Tento „kolaps signálu“ vylučuje falešné výhody způsobené numerickou implementací, chybami jednotek nebo nesprávným zacházením s kovariancí.

Obr. R1 | Negativní kontrola: po seskupení shuffle signál uzavření výrazně klesá (vykresleno z metrik Tab_Z1).


5.3 Význam a limity výsledků

Závěr této studie zní, že „při tomto datovém souboru a tomto protokolu korekce střední gravitace EFT překonává testovaný referenční model DM_RAZOR“. Je třeba zdůraznit, že strana DM používá pouze minimální referenční model NFW s pevnou relací c(M), bez tvorby jader, nesféricity, environmentálních členů či složitějších modelů spojení galaxie–halo. Tento rukopis proto netvrdí, že vylučuje všechny rodiny modelů DM. Místo toho poskytuje reprodukovatelný kontrolní referenční model se středem v testu uzavření pro vyhodnocení, zda lze RC a GGL konzistentně vysvětlit stejnými parametry a mapováním napříč daty.

Abychom tuto běžnou obavu řešili, dokončili jsme nezávislý rozšiřující projekt P1A (viz Dodatek B). Beze změny sdíleného mapování RC-bin→GGL-bin nebo auditního rámce posiluje referenční model DM „standardizovaným a auditovatelným“ způsobem: kromě tří jednoparametrových rozšíření (SCAT/AC/FB) dále přidává (i) hierarchický rozptyl c–M + prior hmotnost–koncentrace (DM_HIER_CMSCAT), (ii) jednoparametrový proxy model baryonického feedbackového jádra (DM_CORE1P) a (iii) nuisance parametr m kalibrace smyku na straně slabého čočkování (DM_RAZOR_M) a uvádí kombinovaný model DM_STD; EFT_BIN je zachován jako kontrolní reference.

• DM_RAZOR_SCAT (rozptyl c–M) — zavádí parametr rozptylu koncentrace mezi haly σ_logc, aby otestoval, zda pevné c(M) systematicky nepodceňuje vysvětlovací sílu DM;
• DM_RAZOR_AC (adiabatická kontrakce) — používá jediný parametr α_AC k plynulé interpolaci mezi „bez kontrakce“ a „standardní kontrakcí“, čímž s minimálními náklady zachycuje tendenci baryonů kontrahovat vnitřní halo;
• DM_RAZOR_FB (feedback/core) — používá škálu jádra (např. log r_core) k popisu toho, jak tvorba vnitřního jádra potlačuje rotační křivky, při zachování aproximace NFW na škálách slabého čočkování.

Kvantitativní scoreboard P1A je uveden v Dodatku B, tabulce B1 / obr. B1 (automaticky generováno z Tab_S1_P1A_scoreboard). V metrice uzavření dává DM_RAZOR_FB malé čisté zlepšení (122.21→129.45, +7.25), zatímco ostatní rozšíření přispívají k síle uzavření nevýznamně nebo negativně. Na straně společného fitu může přidání hierarchického prioru rozptylu c–M (DM_HIER_CMSCAT) nebo kombinovaného modelu (DM_STD) podstatně zlepšit společné logL, ale nezlepšuje sílu uzavření, což naznačuje, že přidává hlavně flexibilitu společného fitu, nikoli přenositelnost napříč sondami. Hlavní závěr hlavního textu je proto třeba číst následovně: při přísných omezeních sdíleného mapování a testu uzavření nevzniká výhoda konzistence EFT napříč daty z volby „příliš slabé základny“ na straně DM. Balíček vydání P1A odpovídající Dodatku B (doplňkové tabulky/obrázky a full_fit_runpack) bude zahrnut jako další soubory pod stejným Zenodo Concept DOI jako full_fit_runpack pro tento článek: https://doi.org/10.5281/zenodo.18526286.

6 Robustnost a kontrolní experimenty


6.1 Sken σ_int (Run-5)

Systematicky skenujeme vnitřní rozptyl RC σ_int a opakujeme společnou inferenci při každé hodnotě σ_int, přičemž počítáme ΔlogL_total relativně k DM_RAZOR. Minimální/maximální hodnoty ΔlogL_total pro každý model napříč skenovaným rozsahem jsou uvedeny v tabulce S1b.

Obr. R2 | Rozsah ΔlogL_total při skenu σ_int (vyšší je lepší).


6.2 Sken R_min (Run-6)

Abychom otestovali dopad systematik v datech centrálních oblastí (například nekruhový pohyb, rozlišení a nedostatečné baryonické modelování), aplikujeme prahové řezy R_min na RC a opakujeme společnou inferenci. Výhoda rodiny EFT zůstává při skenu R_min kladná a stabilní co do škály.

Obr. R3 | Rozsah ΔlogL_total při skenu R_min (vyšší je lepší).


6.3 Sken cov-shrink (Run-7)

Abychom otestovali nejistotu v kovarianci GGL, aplikujeme shrinkage na kovarianční matici každého hmotnostního binu: C_α=(1−α)C+α·diag(C), a skenujeme α. Výsledky ukazují, že výhoda rodiny EFT je vůči tomuto zacházení necitlivá.

Obr. R4 | Rozsah ΔlogL_total při skenu cov-shrink (vyšší je lepší).


6.4 Ablační žebřík (Run-8)

V rámci EFT_BIN provádíme vnořené ablace: od minimálního modelu (bez volných parametrů), přes verze zachovávající pouze malý počet stupňů volnosti, až po úplný model 20 amplitud binů + globální škály. AICc/BIC ukazují, že úplný model EFT_BIN je daty silně vyžadován.

Obr. R5 | Ablační žebřík EFT_BIN (AICc; nižší je lepší).


6.5 Predikce s vynechaným binem (Run-9)

Dále spouštíme test leave-one-bin-out (LOO): mezi 4 hmotnostními biny GGL je vždy jeden bin vynechán; inference se znovu provede s použitím zbývajících binů (a všech RC) a poté se testovací log-likelihood vyhodnotí na vynechaném binu. Souhrnné metriky jsou uvedeny v doplňkové tabulce Tab_R3_leave_one_bin_out (produkt Run-9; vzory cest souborů jsou uvedeny v seznamu klíčových produktů v oddílu 8.2). Rodina EFT zůstává jasně lepší než DM_RAZOR i v nejhorším vynechaném případě.

Obr. R6 | LOO: rozdělení log-likelihood pro vynechaný bin (z produktů Run-9).


6.6 Negativní kontrola: shuffle RC-binů (Run-10)

Run-10 náhodně přeskupuje 20 RC binů do 4×5 a znovu počítá uzavření, přičemž ponechává posterior pouze z RC beze změny. Výsledky ukazují, že oproti původnímu mapování shuffle významně snižuje jak průměrnou logL_true uzavření, tak ΔlogL_closure (viz tabulka S1b a obr. R1), což dále podporuje interpretovatelnost signálu uzavření.

Obr. R7 | Negativní kontrola: mapování shuffle způsobuje jasný pokles průměrné logL_true uzavření (z produktů Run-10).

7 Dohledatelnost a audit konzistence (provenance)

Všechny číselné hodnoty citované v tomto článku lze položku po položce dohledat v přísných souhrnných tabulkách a auditních záznamech archivu vydání. Aby byl hlavní text čitelnější, úplný řetězec provenience (seznam tagů, auditní tabulky, seznam kontrolních součtů a metoda ověření) byl přesunut do Dodatku A.

8 Reprodukovatelnost a archiv Zenodo

Prohlášení o dostupnosti dat a kódu: data rotačních křivek SPARC a data slabého čočkování KiDS-1000 použitá v tomto článku jsou veřejné datové soubory. Publikační zpráva byla archivována na Zenodu (Concept DOI: https://doi.org/10.5281/zenodo.18526334) a úplný reprodukční balíček byl archivován na Zenodu (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Podrobné kroky spuštění, prostředí závislostí, inventář archivu a informace o ověření hashů jsou uvedeny v Dodatku A; návrh, tagy běhů a výstupy zátěžového testu standardizace referenčního modelu DM (P1A) jsou uvedeny v Dodatku B.

Pod stejným Concept DOI úplného reprodukčního balíčku (https://doi.org/10.5281/zenodo.18526286) poskytujeme dva reprodukovatelné vstupní body podle případu použití: • P1 (hlavní text) full_fit_runpack: reprodukuje analýzy pouze z RC / uzavření / společné analýzy a skeny robustnosti pro EFT vs DM_RAZOR a generuje aktiva hlavního textu včetně tabulek S1a/S1b a obr. S3/S4; • P1A (Dodatek B) full_fit_runpack: reprodukuje zátěžový test standardizace referenčního modelu DM (SCAT/AC/FB + hierarchický prior rozptylu c–M + core1p + čočkovací m + DM_STD, včetně kontroly EFT_BIN) a generuje tabulku B1 a obr. B1 v Dodatku. Doplňkové tabulky/obrázky a full_fit_runpack P1A budou zahrnuty jako další soubory pod stejným Concept DOI, aby byl zachován jednotný archivní vstupní bod.

9 Poděkování a prohlášení


9.1 Poděkování

Děkujeme týmům SPARC a KiDS-1000 za poskytnutí veřejných dat a dokumentace a účastníkům rekonstrukčního a auditního pracovního postupu tohoto projektu.


9.2 Příspěvky autora

Guanglin Tu byl odpovědný za koncepční návrh, design studie, inženýrskou implementaci, správu dat, formální analýzu, implementaci a audit reprodukovatelného pracovního postupu a psaní rukopisu.


9.3 Financování

Samofinancováno autorem, Guanglinem Tu (bez externího financování / bez čísla grantu).


9.4 Střet zájmů

Autor, Guanglin Tu, je afiliován s „EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (Čína)“; nejsou deklarovány žádné další střety zájmů.


9.5 Pomoc AI

OpenAI GPT-5.2 Pro a Gemini 3 Pro byly použity k jazykovému leštění, strukturální editaci a organizaci reprodukovatelného pracovního postupu. Nebyly použity k vytváření ani úpravě dat, výsledků, obrázků, tabulek či kódu, ani k vytváření citací. Autor nese plnou odpovědnost za obsah a přesnost citací celého rukopisu.

10 Literatura

Dodatek A: Podrobnosti dohledatelnosti a reprodukovatelnosti

Tento dodatek shrnuje dlouhodobé archivní informace pro dohledatelnost a reprodukovatelnost, včetně tagů běhů, výsledků auditů, archivních inventářů a klíčových ověřovacích bodů, aby čtenáři mohli práci podle potřeby zkontrolovat a reprodukovat.


A.1 Podrobnosti dohledatelnosti a auditu

Aby byla zajištěna dlouhodobá dohledatelnost, tento projekt používá časově označené tagy pro každý běh a výstup a uchovává historické produkty bez jejich přepisování. Klíčové hodnoty citované v tomto rukopisu pocházejí z přísné kompilace (compile_tag=20260205_035929) a prošly následujícími audity konzistence:

• Všechny tabulky na úrovni etap nesou run_tag a etapové tagy; přísný kompilační skript vybírá „úplné a konzistentní“ kanonické zdroje tabulek z report/tables.

• Hodnoty v Tab_Z1_master_summary a Tab_Z2_conclusion_highlights jsou položku po položce porovnány s vybranými kanonickými tabulkami.

• Při generování PDF se provádí audit tagů „odkazovaných tabulek/obrázků“, aby se zajistilo, že nejsou promíchány zastaralé produkty.

Klíčové tagy (pro lokalizaci všech mezilehlých produktů): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Výsledek auditu konzistence: Tab_AUDIT_checks_strict uvádí pass=9, fail=0, skip=0 (podrobnosti viz balíček vydání).


A.2 Kroky spuštění reprodukce a inventář archivu

Tato studie používá systém reprodukovatelnosti složený z „publikační zprávy + doplňku tabulek/obrázků + plně znovuspustitelného run package“. Čtenáři mohou přímo konzultovat Tables & Figures Supplement a ověřit všechna tabulková/obrazová aktiva citovaná v článku; pro reprodukci číselných hodnot a auditního řetězce od nuly mohou použít full_fit_runpack ke stažení dat a opětovnému spuštění kompletního pracovního postupu. Po dokončení lze vestavěný skript balíčku pro porovnání s referenční tabulkou použít k ověření konzistence hodnot tabulek.


A.2.1 Rychlý start reprodukce (RUN_FULL, Windows PowerShell)

Tento oddíl uvádí kratší reprodukční cestu (Windows PowerShell). Pro rychlé kontroly se čtenářům doporučuje přímo konzultovat Tables & Figures Supplement a ověřit citované tabulky a obrázky položku po položce. Pro end-to-end reprodukci a generování všech tabulek, obrázků a auditních produktů použijte full_fit_runpack: postupujte podle README/ONE_PAGE_REPRO_CHECKLIST v balíčku a spusťte verify_checksums.ps1 a RUN_FULL.ps1 (doporučeno Mode=full).

Archivní záznam Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Hlavní tagy řetězce pro tento článek: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.


A.2.2 Archivní materiály a klíčové ověřovací body (balíčky a kontroly)

Archiv Zenodo poskytuje tři komplementární kategorie materiálů: (1) publikační zprávu (tento článek, v1.1; včetně Dodatku B: zátěžový test standardizace referenčního modelu DM P1A); (2) Tables & Figures Supplement (doplňkové tabulky a obrázky pokrývající všechna tabulková/obrazová aktiva citovaná v tomto článku, samostatně odpovídající P1 a P1A); a (3) full_fit_runpack (úplný reprodukční balíček: stáhne data od nuly a znovu spustí kompletní pracovní postup, samostatně odpovídající P1 a P1A). Položky (1)–(2) podporují rychlé čtení a nezávislé ověření; položka (3) poskytuje úplnou end-to-end reprodukovatelnost.

Kategorie materiálu

Název souboru (příklad)

Účel a zařazení (doporučené pořadí použití)

Publikační zpráva (čínsky a anglicky)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Úplná zpráva archivovaná na Zenodu; hlavní text uvádí klíčové závěry a audity robustnosti a Dodatek B uvádí P1A (zátěžový test standardizace referenčního modelu DM).

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Všechny tabulky (CSV) a obrázky (PNG) citované v hlavním textu, včetně generačních skriptů a tagových souborů.

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Všechny tabulky a obrázky citované v Dodatku B (P1A), včetně Tab_S1_P1A_scoreboard a Fig_S1_P1A_scoreboard.

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

Úplná end-to-end reprodukce: stáhnout data od nuly a znovu spustit RC-only/closure/joint a skeny robustnosti.

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

Úplná end-to-end reprodukce (Dodatek B): znovu spustit DM 7+1 + DM_STD (včetně kontroly EFT_BIN) a generovat aktiva dodatku; balíček obsahuje skript pro porovnání s referenční tabulkou za účelem ověření konzistence hodnot tabulek.

Doporučení k citaci: při citování tohoto článku nebo doprovodných materiálů pro reprodukovatelnost citujte prosím Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Klíčové produkty, které by se měly po reprodukci objevit a být porovnatelné, zahrnují:

Dodatek B: P1A — zátěžový test standardizace referenčního modelu DM (DM 7+1 + DM_STD; s kontrolou EFT)

Tento dodatek dokumentuje rozšiřující projekt (P1A) pro „zátěžové testování standardizace referenčního modelu DM“, který je konzistentní s protokolem uzavření v hlavním textu. Jeho rolí je povýšit minimální referenční model DM_RAZOR použitý v hlavním textu (NFW + pevné c–M, žádný rozptyl / žádná kontrakce / žádné jádro) na sadu referenčních modelů DM, která je blíže astrofyzikální praxi a odolnější vůči běžným kritikám, aniž by zaváděla velký počet stupňů volnosti a aniž by měnila sdílené mapování RC-bin→GGL-bin nebo auditní rámec. P1A pokrývá a rozšiřuje dřívější třívětvový zátěžový test: zachovává SCAT/AC/FB a zároveň přidává hierarchický rozptyl c–M + prior, jednoparametrový proxy model jádra a čočkovací nuisance parametr kalibrace smyku m; poskytuje také kombinovaný model DM_STD. EFT_BIN je zachován jako kontrolní reference.

Doplňková poznámka: síly uzavření a související hodnoty v Dodatku B (P1A) používají větší rozpočet Monte Carlo (například ndraw=400, nperm=24) než rychlý rozpočet použitý v hlavním textu k pokrytí celé rodiny jader EFT (například ndraw=60, nperm=12). Absolutní hodnoty proto mohou vykazovat vzorkovací drift na úrovni O(10). Porovnání model–model v rámci stejného rozpočtu/tabulky jsou však férová a znaménko i škála výhody zůstávají napříč rozpočty stabilní.


B.1 Účel a zařazení (proč P1A a proč jako dodatek)

P1A se nepokouší vyčerpat všechny možné volby modelování halo ΛCDM (jako je nesféricita, environmentální závislost, komplexní spojení galaxie–halo nebo vysokodimenzionální baryonická fyzika). Místo toho P1A sleduje princip „nízkorozměrné, auditovatelné, reprodukovatelné“: každý rozšiřující modul zavádí pouze ≤1 klíčový efektivní parametr a nadále podléhá třem tvrdým omezením tohoto článku:
(i) Účetní kniha parametrů: každý nový parametr musí být explicitně zaznamenán a reportován spolu s informačními kritérii (AICc/BIC);
(ii) Sdílené mapování: stále se používá stejná skupinová mapa RC-bin→GGL-bin; „ladění mapování“ zvlášť pro jediný datový soubor není povoleno;
(iii) Test uzavření: každé rozšíření musí ukázat skutečný zisk v přenosové predikci RC→GGL, nikoli pouze lepší fitování pouze z RC.


B.2 DM 7+1 + DM_STD: Definice modulů, parametry a vstup do společného posterioru

Jako nezávislý runpack poskytuje P1A 8 pracovních prostorů DM (DM 7+1) plus 1 kontrolu EFT: počínaje DM_RAZOR jako základnou konstruuje tři legacy jednoparametrová rozšíření (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), přidává tři standardnější defenzivní moduly (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) a poté poskytuje kombinovaný model DM_STD. Sdíleným cílem těchto modulů je pokrýt tři nejběžnější kritiky při co nejmenším zvýšení dimenzionality: (a) jak rozptyl c–M a priory vstupují do hierarchického modelu; (b) zda lze hlavní efekt baryonického feedbacku zachytit jednoparametrovým proxy modelem jádra; a (c) zda by klíčové systematiky na straně čočkování mohly být zaměněny za fyzikální signál.

Workspace

dm_model

Nový parametr / parametry (≤1)

Fyzická motivace (jádro)

Princip implementace (audit-friendly)

DM_RAZOR

NFW (fixed c–M, no scatter)

Minimální, auditovatelný referenční model halo ΛCDM; použit pro přísné srovnání s EFT

Pevné sdílené mapování; přísná účetní kniha parametrů; použit jako základna pouze pro relativní srovnání

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

Relace c–M má rozptyl; aproximováno jednoparametrovým lognormálním rozptylem

≤1 nový parametr; sdílené mapování zachováno; zisk uzavření použit jako akceptační kritérium

DM_RAZOR_AC

NFW + Adiabatic Contraction (legacy)

α_AC

Baryonický pád může vyvolat adiabatickou kontrakci halo; aproximováno jednoparametrovou intenzitou

≤1 nový parametr; mapování beze změny; reportují se změny AICc/BIC a zisk uzavření

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback může ve vnitřní oblasti vytvořit jádro; aproximováno jednoparametrovou škálou jádra

≤1 nový parametr; stejný protokol uzavření/negativní kontroly; zlepšení RC-only není jediným cílem

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

Standardnější hierarchické c_i∼logN(c(M_i),σ_logc); ovlivňuje společný posterior RC i GGL

Explicitní prior; latentní c_i marginalizováno; stále nízkorozměrné a auditovatelné

DM_CORE1P

1-parameter core proxy (coreNFW/DC14-inspired)

log r_core

Používá jednoparametrový proxy model jádra pro hlavní efekt baryonického feedbacku a vyhýbá se vysokodimenzionálním detailům tvorby hvězd

Cituje standardní literaturu; ≤1 nový parametr; navázáno na test uzavření

DM_RAZOR_M

NFW + lensing shear-calibration nuisance

m_shear (GGL)

Absorbuje klíčovou systematiku slabého čočkování jako efektivní parametr, čímž snižuje riziko záměny systematik za fyziku

Nuisance explicitně zaznamenán; nemůže zpětně ovlivnit RC; výsledky posuzovány hlavně podle robustnosti uzavření

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Zahrnuje tři nejběžnější třídy kritik v stále nízkorozměrném standardním referenčním modelu

Účetní kniha parametrů + informační kritéria reportována; uzavření je primární metrika; použit jako nejsilnější defenzivní kontrola DM

Poznámka: výše uvedené názvy parametrů sledují inženýrskou implementaci (například σ_logc, α_AC, log r_core a m_shear). Designový důraz P1A je „udělat referenční model DM poněkud silnější, ale udržet jej auditovatelný“, nikoli proměnit stranu DM v nekontrolovatelný vysokodimenzionální fitter. Konkrétně DM_HIER_CMSCAT zavádí rozptyl c–M hierarchicky: koncentrace c_i každého halo dostává lognormální rozptyl kolem c(M_i), omezený globálním σ_logc a priorem c(M); tato hierarchická struktura ovlivňuje společný posterior RC i GGL.


B.3 Statistický protokol a produktové konvence konzistentní s hlavním textem

P1A znovu používá všechny datové produkty, sdílené mapování a auditní rámec z hlavního textu. Pořadí spuštění a produktové konvence zůstávají konzistentní:
(1) Run‑1: inference pouze z RC (vytváří posterior_samples.npz a metrics.json);
(2) Run‑2: test uzavření RC→GGL (vytváří closure_summary.json a permutovanou základnu);
(3) Run‑3: společný fit RC+GGL (vytváří joint_summary.json).
Všechna citovaná čísla pocházejí z automaticky kompilované tabulky (Tab_S1_P1A_scoreboard) a lze je ověřit po opětovném spuštění celého pracovního postupu P1A pomocí skriptu pro porovnání s referenční tabulkou zabudovaného ve full_fit_runpack P1A.


B.4 Hlavní výsledky, vstupní body tabulek/obrázků a archivní plán (stejné DOI)

Tento oddíl uvádí klíčové kvantitativní závěry P1A. Tabulka B1 shrnuje klíčové metriky pro RC-only, uzavření RC→GGL a společné fitování RC+GGL (závorky uvádějí rozdíly relativně k referenčnímu modelu DM_RAZOR). Síla uzavření je definována jako ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (vyšší je lepší). Obr. B1 vizualizuje stejný scoreboard. Hlavní body jsou následující:
• Ze tří legacy větví poskytuje pouze DM_RAZOR_FB (feedback/core) malé čisté zlepšení síly uzavření: 122.21→129.45 (+7.25); SCAT a AC neposkytují žádné čisté zlepšení;
• Nově přidané DM_HIER_CMSCAT a DM_RAZOR_M mají velmi malé účinky (~0) na sílu uzavření a DM_CORE1P rovněž nevykazuje významné čisté zlepšení;
• Kombinovaný model DM_STD může podstatně zlepšit společné logL (blíže optimu společného fitu), ale jeho síla uzavření klesá, což naznačuje, že jeho zisk pochází hlavně z flexibility společného fitu, nikoli z přenositelnosti napříč sondami;
• Jako kontrola si EFT_BIN stále zachovává jasnou výhodu jak v síle uzavření, tak ve společném fitování. Hlavní závěr je proto robustní vůči zavedení „silnějšího referenčního modelu DM + čočkovacího nuisance parametru“.

Pro přímé srovnání s výsledky hlavního textu shrnují tabulky S1a–S1b přísné srovnání mezi rodinou EFT a DM_RAZOR: modely EFT zlepšují společný fit o ΔlogL_total≈1155–1337 relativně k DM_RAZOR a v testu uzavření dosahují ΔlogL_closure=172–281. P1A vytváří pouze „tvrdší kontrolu“ na straně DM; jeho účelem je snížit obavy typu „strawman baseline“ nebo „systematiky jako fyzika“, nikoli nahradit hlavní srovnání.

Tabulka B1 | Scoreboard P1A (vyšší je lepší; závorky označují rozdíly relativně k referenčnímu modelu DM_RAZOR).

Modelová větev (workspace)

Δk

Nejlepší logL_RC pouze z RC (Δ)

Síla uzavření ΔlogL_closure (Δ)

Nejlepší společné logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Obr. B1 | Scoreboard P1A: uzavření a společné ΔlogL relativně k základně (vyšší je lepší).

Příkladové tagy pro dokončenou sadu běhů odpovídající tomuto dodatku jsou následující (používají se k lokalizaci mezilehlých produktů P1A a tabulek/obrázků):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 Doporučená citace (poznámka k citování dodatku)

Když čtenáři potřebují kromě hlavních závěrů článku citovat také „zátěžový test standardizace referenčního modelu DM“, doporučuje se citovat hlavní závěr spolu s následující poznámkou: „Viz Dodatek B (P1A) pro standardizované zátěžové testy referenčního modelu DM (legacy SCAT/AC/FB + hierarchický prior rozptylu c–M + proxy jádra + nuisance parametr kalibrace čočkovacího smyku), při stejném protokolu uzavření.“