Vysvětlení zprávy P1

Od rotačních křivek ke slabému čočkování: test střední gravitační odezvy EFT

Průvodce pro širší veřejnost založený na P1_RC_GGL: přísný test uzavření dynamiky galaxií a slabého čočkování (v1.1)

Původní zpráva: Guanglin Tu | Základ verze: P1 v1.1 | Redakční status: popularizační vysvětlující návrh / nikoli recenzovaný článek
Související archivy: DOI zprávy 10.5281/zenodo.18526334 | DOI reprodukčního balíku 10.5281/zenodo.18526286

Prohlédněte si původní hodnoticí zprávu:

1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc

2. Gemini: https://gemini.google.com/share/773ec96d75a0

3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04

4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46

5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm

6. Doubao: https://www.doubao.com/thread/w166b207d7345e46a

Poznámka ke čtení

Toto je vysvětlující verze, nikoli samostatná akademická zpráva. Vychází z původní zprávy P1, zachovává klíčové obrázky a tabulky a doplňuje srozumitelná vysvětlení toho, co každý hlavní krok znamená.

Tento průvodce vysvětluje pouze to, k čemu P1 dochází v rámci svých určených datových sad, registru parametrů a statistického protokolu: ve společném testu rotačních křivek galaxií (RC) a slabého čočkování galaxie–galaxie (GGL) model střední gravitační odezvy EFT jasně překonává zde testovanou minimální základní linii DM_RAZOR.

Tento průvodce nevykládá P1 jako tvrzení, že „temná hmota byla vyvrácena“. P1 je pouze první krok experimentů série P. Testuje jednu pozorovatelnou vrstvu EFT — „střední gravitační základnu“ — nikoli celý obsah úplného rámce EFT.

0 | P1 za pět minut: co tento test vlastně dělá?

P1 si lze představit jako test konzistence napříč pozorovacími sondami. Neptá se pouze na to, zda model dokáže přizpůsobit jednu datovou sadu. Místo toho klade na stejný auditní stůl dva velmi odlišné gravitační odečty: rotační křivky (RC) čtou dynamiku uvnitř galaktických disků, zatímco slabé čočkování galaxie–galaxie (GGL) čte projektovanou gravitační odezvu ve větších měřítkách.

RC je jako rychloměr: říká nám, jak rychle se plyn a hvězdy otáčejí v různých poloměrech galaktického disku.
GGL je jako váha: tím, že měří, jak galaxie v popředí nepatrně ohýbají světlo galaxií v pozadí, odvozuje průměrné rozložení gravitace/hmoty kolem galaxií ve větších měřítkách.
Ústřední otázka P1 zní: může se tentýž model nejprve naučit vzorec z RC, poté jej přenést na GGL a stále dávat smysl?

P1 jednou větou

P1 zvyšuje laťku z „fitne to dobře jednu sondu?“ na „uzavře se to napříč sondami?“ Model pravděpodobněji zachytil gravitační strukturu sdílenou RC a GGL pouze tehdy, když pod správnou mapou funguje dobře a po promíchání mapy signál kolabuje.

Tabulka 0 | Klíčová čísla P1 a jak je číst

Metrika	Čtení v P1 / P1A	Význam v běžném jazyce
Společný fit ΔlogL_total	V hlavním textovém srovnání je EFT o 1155–1337 nad DM_RAZOR	Celkový rozdíl skóre přes obě datové sady; větší znamená lepší celkové vysvětlení.
Síla uzavření ΔlogL_closure	V hlavním textovém srovnání má EFT 172–281, zatímco DM_RAZOR má 127	Schopnost predikovat GGL po odvození pouze z RC; větší znamená silnější sebekonzistenci napříč sondami.
Promíchání negativní kontroly	Po promíchání RC-bin→GGL-bin klesne signál uzavření EFT na 6–23	Pokud se správná korespondence poruší, výhoda má zmizet; čím ostřejší je kolaps, tím lépe vylučuje falešný signál.
Vícenásobný DM zátěžový test P1A	DM 7+1 + DM_STD, s EFT_BIN ponechaným jako srovnání	P1A se nedívá pouze na minimální základnu DM_RAZOR. Vkládá několik nízkodimenzionálních, auditovatelných větví zesílení DM do stejného protokolu uzavření.

1 | Proč dělat P1? Kde se kosmologie v galaktickém měřítku zasekla?

Problémy v galaktickém měřítku zůstávají obtížné, protože „požadavek dodatečné gravitace/hmoty“ není jen jevem rotačních křivek. Mnohá pozorování ukazují těsnou vazbu mezi viditelnou baryonovou hmotou v galaxiích a skutečnými dynamickými či čočkovacími odečty. Pro cestu temné hmoty to znamená, že temná hala, baryonová zpětná vazba, historie vzniku galaxií a pozorovací systematiky musí být koordinovány s velkou přesností. Pro gravitační směry bez temné hmoty to znamená, že model nemůže jen dobře vypadat na RC; musí přežít také slabé čočkování, populační škálovací vztahy a negativní kontroly.

Právě to je motivace P1. Nevychází z tvrzení „temná hmota je špatně“ ani „EFT musí být správná“. Bere do auditu jedno testovatelné tvrzení: může střední gravitační odezva EFT zanechat v uzavření napříč sondami RC→GGL reprodukovatelný a přenositelný signál?

Kontext externí literatury: proč je okno RC+GGL důležité

Vztah radiálního zrychlení (RAR), který v roce 2016 navrhli McGaugh, Lelli a Schombert, ukazuje těsnou korelaci s malým rozptylem mezi pozorovaným zrychlením sledovaným rotačními křivkami a zrychlením předpovězeným z baryonové hmoty. Tím se „vazba baryon–gravitační odezva“ stává nevyhnutelnou pro teorii v galaktickém měřítku.

Brouwer et al. (2021) použili slabé čočkování KiDS-1000 k rozšíření RAR na nižší zrychlení a větší poloměry a porovnávali MOND, Verlindeho emergentní gravitaci a modely LambdaCDM. Zároveň poznamenali, že rozdíly mezi ranými a pozdními typy galaxií, plynová hala a spojení galaxie–halo zůstávají klíčovými vysvětlujícími otázkami.

Mistele et al. (2024) dále použili slabé čočkování k odvození kruhových rychlostních křivek izolovaných galaxií a uvedli, že nevykazují jasný pokles až do několika set kpc, a dokonce zhruba do 1 Mpc, v souladu s BTFR. To ukazuje, že slabé čočkování se stává důležitým externím odečtem pro testování gravitační odezvy v galaktickém měřítku.

Hodnota P1 tedy není v tom, že by šlo o „první diskusi RC a GGL dohromady“. Její hodnota spočívá v tom, že je vkládá do auditovatelného protokolu postaveného z pevné mapy, registru parametrů, uzavření RC-only→GGL, negativních kontrol promícháním a vícenásobných DM zátěžových testů P1A.

2 | Co znamená EFT v P1? Není to Effective Field Theory

Zde EFT označuje Teorii Energetického Vlákna (Energy Filament Theory, EFT), nikoli efektivní teorii pole běžně používanou ve fyzice. V technické zprávě P1 se EFT používá zdrženlivě: nevstupuje do srovnání jako úplná konečná teorie, ale je nejprve stlačena do pozorovatelné, fitovatelné a falzifikovatelné parametrizace „střední gravitační odezvy“.

Jednoduše řečeno, P1 nezačíná diskusí o každém mikroskopickém zdroji dodatečné gravitace a nepokouší se najednou prokázat celý rámec EFT. Klade užší a tvrdší otázku: pokud v galaktických měřítkách existuje nějaká střední dodatečná gravitační odezva, dokáže nejprve vysvětlit RC a poté se přenést k predikci GGL?

Kterou část EFT P1 testuje?

P1 cílí na „střední gravitační základnu“: statisticky stabilní střední příspěvek, který se může přenášet napříč vzorky.

P1 zatím neřeší „stochastickou/šumovou základnu“: náhodné členy, individuální rozdíly nebo dodatečný rozptyl, které mohou zavádět mikroskopičtější fluktuační procesy.

P1 také neřeší úplný mikroskopický mechanismus, četnost, životnost ani globální kosmologická omezení. Je to první krok experimentů série P, nikoli konečný verdikt.

3 | Plán série P1: proč začít „střední základnou“?

Sérii P lze chápat jako pozorovací vyhledávací program EFT. Nepředkládá všechna tvrzení najednou; místo toho izoluje část, kterou lze nejsnáze testovat veřejnými daty. Strategie P1 je nejprve otestovat střední člen: pokud se střední gravitační odezva nedokáže ani uzavřít z RC do GGL, pak diskuse o složitějších šumových členech nebo mikroskopických mechanismech nemá řádný vstupní bod.

Tabulka 1 | Vrstvené umístění série P

Vrstva	Položená otázka	Role v P1
P1	Může se střední gravitační odezva uzavřít v RC→GGL?	Hlavní otázka této zprávy
P1A	Pokud se strana DM posílí, zůstane závěr stabilní?	Dodatek B: zátěžový test DM 7+1 + DM_STD
Pozdější práce série P	Lze protokol rozšířit na více dat, více sond a složitější systematiky?	Směr budoucí práce
Otázky hlubší úrovně	Jak se propojují střední člen, šumový člen a mikroskopický mechanismus?	Mimo rozsah závěrů P1

4 | Jaká jsou data? Co nám říkají RC a GGL?

4.1 Rotační křivky (RC): „rychloměr“ uvnitř galaktických disků

Rotační křivky zaznamenávají, jak rychle plyn a hvězdy obíhají kolem středu galaxie v různých poloměrech. Čím rychlejší rotace, tím silnější dostředivá síla je v daném poloměru zapotřebí — a tedy tím silnější je efektivní gravitace. P1 používá databázi SPARC; po předzpracování obsahuje 104 galaxií a 2 295 rychlostních bodů rozdělených do 20 RC-binů.

4.2 Slabé čočkování (GGL): větší „gravitační váha“

Slabé čočkování galaxie–galaxie měří, jak galaxie v popředí nepatrně ohýbají světlo galaxií v pozadí. Odpovídá projektované gravitační odezvě ve větších, halových poloměrech a nezávisí na detailech dynamiky plynu uvnitř galaxie. P1 používá veřejná data GGL z KiDS-1000 / Brouwer et al. (2021): 4 biny hvězdné hmotnosti, 15 radiálních bodů v každém binu, celkem 60 datových bodů, přičemž je použita plná kovariance.

4.3 Pevná mapa: proč záleží na 20 RC-binech → 4 GGL-biny

P1 propojuje 20 RC-binů se 4 GGL-biny pomocí pevného pravidla: každý GGL-bin odpovídá 5 RC-binům, spojeným průměrováním váženým počtem galaxií. Tato mapa zůstává beze změny pro všechny modely a funguje jako tvrdé omezení pro testování uzavření i férové srovnání.

Proč mapu nedolaďovat až dodatečně?

Kdyby bylo možné až dodatečně zvolit, „které RC-biny odpovídají kterým GGL-binům“, model by mohl vyrobit uzavření přeuspořádáním korespondence. P1 předem zamyká mapování 20→4 a záměrně je porušuje negativní kontrolou promícháním právě proto, aby posoudil, zda signál uzavření skutečně závisí na fyzikálně rozumné korespondenci.

5 | Modely a metody: co přesně P1 srovnává?

5.1 Strana EFT: nízkodimenzionální střední gravitační odezva

Na straně EFT se pro popis střední gravitační odezvy používá nízkodimenzionální dodatečný rychlostní člen. Tvar dodatečného členu je řízen bezrozměrnou jádrovou funkcí f(r/ℓ), kde ℓ je globální měřítko, a amplituda je přiřazena podle RC-binu. Různá jádra představují různé počáteční sklony, rychlosti přechodu a dlouhodosahové chvosty a používají se pro zátěžové testy robustnosti.

5.2 Strana DM: hlavní textové srovnání a dodatek P1A je nutné číst odděleně

V hlavním textovém srovnání je DM_RAZOR minimalizovaná, auditovatelná základní linie NFW: používá pevný vztah c–M a nezahrnuje rozptyl mezi haly, adiabatickou kontrakci, jádra ze zpětné vazby, nesféricitu ani environmentální členy. Silnou stránkou tohoto návrhu jsou řízené stupně volnosti a snadná reprodukovatelnost; slabinou je, že nemůže reprezentovat každý model LambdaCDM nebo každé halo temné hmoty.

Proto je v dodatku B (P1A) strana DM převedena na soubor „standardizovaných zátěžových testů“. Beze změny sdílené mapy nebo protokolu uzavření P1A postupně přidává nízkodimenzionální větve zesílení, jako jsou SCAT, AC, FB, HIER_CMSCAT, CORE1P, čočkovací m a kombinovaná základní linie DM_STD, přičemž EFT_BIN ponechává jako srovnání. Stručně řečeno, P1A není srovnáním pouze s jednou minimální základnou DM; měří soubor běžných, auditovatelných mechanismů DM stejným „pravítkem uzavření“.

Přesné rámování závěru použité zde

Hlavní text: rodina EFT v hlavním srovnání výrazně překonává minimální DM_RAZOR.

Dodatek B / P1A: pod několika nízkodimenzionálními, auditovatelnými větvemi zesílení DM a zátěžovým testem DM_STD se některé společné DM fity zlepšují, ale síla uzavření neodstraňuje výhodu EFT_BIN.

Nejbezpečnější formulace tedy zní: v rámci dat, mapy, registru parametrů a protokolu uzavření P1/P1A vykazuje střední gravitační odezva EFT silnější konzistenci napříč daty; to není totéž jako vyloučení všech modelů temné hmoty.

5.3 Testování uzavření: nejdůležitější experimentální syntaxe P1

1. Fitovat pouze pomocí RC a získat sadu posteriorních vzorků RC-only.

2. Nepřelaďovat pomocí GGL; použít RC posterior přímo k predikci GGL.

3. Použít plnou kovarianci k výpočtu skóre predikce GGL pod správnou mapou, logL_true.

4. Náhodně permutovat korespondenci RC-bin→GGL-bin a vypočítat skóre negativní kontroly, logL_perm.

5. Odečíst tyto dvě hodnoty a získat sílu uzavření: ΔlogL_closure = <logL_true> − <logL_perm>.

Analogii v běžném jazyce

Test uzavření je jako opakovaná zkouška v jiné místnosti. Model se nejprve naučí vzorce v místnosti RC a poté odpovídá v místnosti GGL. Pokud se naučil sdílené pravidlo, nikoli lokální trik, měl by i po změně místnosti odpovídat dobře; pokud je korespondence mezi místnostmi záměrně promíchána, výhoda by měla zmizet.

5.4 Před čtením technických tabulek: čtyři vstupní body

Tabulka 5.4 | Cesta čtení pro následující sadu technických tabulek na šířku

Vstupní bod	Na co se dívat	Proč na tom záleží
Tabulka S1a	Celkové skóre společného fitu RC+GGL	Odpovídá na otázku: „Když se na dvě datové sady díváme společně, čí celkové vysvětlení je silnější?“
Tabulka S1b	Síla uzavření, promíchání a skeny robustnosti	Odpovídá na otázku: „Může se to, co bylo naučeno z RC, přenést na GGL?“
Tabulka B0	Definice několika větví zesílení DM v P1A	Brání tomu, aby byla P1 zredukována na „pouze srovnání s minimální DM_RAZOR“.
Tabulka B1	Výsledková tabule uzavření a společného fitu P1A	Kontroluje, zda výhoda uzavření po posílení DM mizí.

Poznámka k rozvržení

Stránky na šířku začínají na následující stránce, aby široké tabulky z původní zprávy mohly zůstat neporušené bez mazání sloupců nebo stlačování do nečitelnosti. Hlavní text již podal čtení v běžném jazyce; technické tabulky na šířku jsou určeny čtenářům, kteří potřebují ověřit hodnoty a modelové větve.

Obrázek 0.1 | Pracovní postup testu uzavření P1 v jednom diagramu

Poznámka: horní řetězec je „test uzavření“ (fit pouze na RC → použít RC posterior k predikci GGL); dolní řetězec je „společný fit“ (skórovat RC+GGL dohromady). Vpravo se skutečná mapa porovnává s promíchanou mapou, aby se získala síla uzavření ΔlogL.

6 | Klíčové technické tabulky: hlavní tabulky z původní zprávy a tabulky P1A

Tabulka S1a | Hlavní metriky srovnání společného fitu (RC+GGL, přísné; převzato z původní zprávy)

Model (pracovní prostor)	Jádro W	k	Společné logL_total (nejlepší)	ΔlogL_total vůči DM	AICc	BIC
DM_RAZOR	žádné	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	none	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponenciální	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	Yukawovo	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

Tabulka S1b | Metriky uzavření a robustnosti (přísné; převzato z původní zprávy)

Model (workspace)	Uzavření ΔlogL (true-perm)	ΔlogL po promíchání negativní kontroly	Rozsah ΔlogL při skenu σ_int	Rozsah ΔlogL při skenu R_min	Rozsah ΔlogL při skenu cov-shrink
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

Tabulka B0 | Definice větví zesílení DM v P1A (převzato z dodatku B původní zprávy)

Pracovní prostor	dm_model	Nový parametr (≤1)	Fyzikální motivace (jádro)	Princip implementace (auditovatelný)
DM_RAZOR	NFW (pevné c–M, bez rozptylu)	—	Minimální, auditovatelná základna hala LambdaCDM; používá se jako přísné srovnání s EFT	Pevná sdílená mapa; přísný registr parametrů; používá se pouze jako základna relativního srovnání
DM_RAZOR_SCAT	NFW + rozptyl c–M（legacy）	σ_logc	Vztah c–M má rozptyl; aproximuje se jednoparametrovým log-normálním rozptylem	≤1 nový parametr; stále používá sdílenou mapu; zisk uzavření je kritériem přijetí
DM_RAZOR_AC	NFW + adiabatická kontrakce（legacy）	α_AC	Baryonový spad může způsobit adiabatickou kontrakci hala; aproximuje se jednoparametrovou silou	≤1 nový parametr; mapa beze změny; hlásí změny AICc/BIC a zisk uzavření
DM_RAZOR_FB	NFW + jádro zpětné vazby（legacy）	log r_core	Zpětná vazba může vytvořit vnitřní jádro; aproximuje se jednoparametrovým měřítkem jádra	≤1 nový parametr; stejné rámování uzavření/negativní kontroly; zlepšení RC-only není jediným cílem
DM_HIER_CMSCAT	Hierarchický rozptyl c–M + prior	σ_logc（hier）	Standardnější hierarchické c_i∼logN(c(M_i),σ_logc); ovlivňuje společný posterior RC a GGL	Explicitní prior; latentní c_i marginalizovány; zůstává nízkodimenzionální a auditovatelné
DM_CORE1P	Jednoparametrový proxy jádra (inspirovaný coreNFW/DC14)	log r_core	Používá jednoparametrový proxy jádra pro hlavní efekt baryonové zpětné vazby a vyhýbá se vysokodimenzionálním detailům tvorby hvězd	Cituje standardní literaturu; ≤1 nový parametr; navázáno na test uzavření
DM_RAZOR_M	NFW + nuisance kalibrace smyku čočkování	m_shear（GGL）	Pohlcuje klíčovou systematiku na straně slabého čočkování pomocí efektivního parametru, čímž snižuje riziko, že systematiky budou vykládány jako fyzika	Nuisance je výslovně zaznamenána; nesmí zpětně působit na RC; výsledky se posuzují hlavně podle robustnosti uzavření
DM_STD	Standardizovaná základna DM (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	Slučuje tři nejběžnější námitky do jedné stále nízkodimenzionální standardizované základny	Hlásí registr parametrů a informační kritéria společně; uzavření je hlavní metrika; používá se jako nejsilnější srovnání obrany DM

Tabulka B1 | Výsledková tabule P1A (větší je lepší; převzato z dodatku B původní zprávy)

Větev modelu (pracovní prostor)	Δk	Nejlepší logL_RC pro RC-only (Δ)	Síla uzavření ΔlogL_closure (Δ)	Nejlepší společné logL_total (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

Jak číst tabulku B1 (výsledková tabule P1A)

• Δk: nově přidané stupně volnosti (větší znamená složitější model; složitější automaticky neznamená lepší).

• Zaměřte se na dva sloupce: síla uzavření ΔlogL_closure(Δ) (větší znamená větší přenosovou sebekonzistenci) a nejlepší společné logL_total(Δ) (celkové skóre společného fitu).

• Hodnota v závorkách, (Δ), je rozdíl relativně k DM_RAZOR, což usnadňuje přímé srovnání.

• Hlavní otázka této tabulky zní, zda výhoda uzavření zmizí poté, co je základna DM „rozumně posílena“.

• Tip ke čtení: DM_STD výrazně zlepšuje společné skóre, ale jeho síla uzavření klesá; EFT_BIN stále zůstává v síle uzavření výše.

Jednou větou: v tomto nízkodimenzionálním, auditovatelném souboru zesílení DM nevede zlepšení společného fitu automaticky k silnějšímu uzavření; uzavření, tedy přenositelnost, zůstává klíčovým kritériem.

7 | Jak číst hlavní výsledky?

7.1 Společný fit: při pohledu přes obě datové sady je skóre hlavního srovnání EFT vyšší

Tabulka S1a a obrázek S4 ukazují, že při stejných datech, stejné sdílené mapě a zhruba stejném měřítku parametrů má rodina EFT společné ΔlogL_total o 1155–1337 vyšší než DM_RAZOR. Obecný čtenář to může chápat takto: pod stejným skórovacím pravidlem aplikovaným na RC a GGL dohromady dostávají modely hlavního srovnání EFT vyšší celkové skóre.

7.2 Test uzavření: P1 chce nejvíce zdůraznit „přenositelnost“

Vysoká síla uzavření znamená, že parametry odvozené pouze z RC dokážou lépe predikovat GGL, aniž by se znovu dívaly na GGL. Ve zprávě P1 je ΔlogL_closure EFT 172–281, zatímco DM_RAZOR má 127. Tento výsledek je důležitější než tvrzení, že „každý model dobře fituje svá vlastní data“, protože omezuje volnost modelu na druhé datové sadě.

7.3 Negativní kontrola: proč je „kolaps signálu“ dobrá věc?

Poté, co P1 náhodně promíchá korespondenci seskupení RC-bin→GGL-bin, signál uzavření EFT klesne do rozsahu 6–23. Pro obecného čtenáře je tento krok jako kontrola proti podvádění: kdyby výhoda uzavření vznikala pouze z kódu, jednotek, zacházení s kovariancí nebo náhody fitování, mohla by výhoda zůstat i pod promíchanou korespondencí. Místo toho skutečná výhoda kolabuje, což ukazuje, že závisí na správné mapě.

Obrázek S3 | Síla uzavření (větší je lepší): průměrná výhoda log-věrohodnosti pro predikci RC-only → GGL.

Jak číst tento obrázek

Tento obrázek je jádrem P1. Čím vyšší sloupec, tím lépe se informace naučená z RC přenáší do GGL.

Rodina EFT je celkově výše než DM_RAZOR, což ukazuje silnější uzavření EFT napříč sondami v experimentu „nejprve se naučit RC, pak predikovat GGL“.

Obrázek S4 | Výhoda společného fitu (větší je lepší): nejlepší logL_total RC+GGL relativně k DM_RAZOR.

Jak číst tento obrázek

Tento obrázek ukazuje celkové skóre po spojení RC a GGL.

Všechny modely EFT jsou výrazně nad 0, což ukazuje, že výhoda EFT v hlavním srovnání není lokální jednorázový efekt, ale celkový vzorec ve společné analýze.

Obrázek R1 | Negativní kontrola: signál uzavření po promíchání seskupení prudce klesá.

Jak číst tento obrázek

Tento obrázek ukazuje, že jakmile je narušen správný vztah binování RC↔GGL, signál uzavření prudce klesá.

Výsledek P1 tak vypadá spíše jako skutečná konzistence v mapování napříč daty než jako číselná náhoda dosažitelná pod libovolnými mapami.

8 | Robustnost a kontroly: jak se P1 vyhýbá tomu, aby byl „jen dobře vypadající fit“?

Nejjednodušší námitka proti technické zprávě zní, zda výhoda nepochází z jednoho nastavení šumu, jednoho řezu dat ve střední oblasti, jednoho zacházení s kovariancí nebo z přefitování. P1 na to odpovídá několika zátěžovými testy.

Tabulka 2 | Jak číst testy robustnosti a negativní kontroly P1

Test	Obava, kterou se snaží vyloučit	Jak to číst
σ_int scan	Pokud RC obsahuje dodatečný neznámý rozptyl, zůstává závěr stabilní?	Po uvolnění chyb RC zůstávají pořadí EFT a měřítko výhody stabilní.
R_min scan	Pokud nejsou centrální oblasti galaxií plně důvěryhodné, zůstává závěr stabilní?	Po oříznutí centrálních oblastí si EFT stále udržuje kladnou výhodu.
cov-shrink scan	Pokud je odhad kovariance GGL nejistý, zůstává závěr stabilní?	Po smrštění kovariance směrem k diagonále není výhoda citlivá.
Ablační žebřík	Spoléhá se EFT na zbytečnou složitost, aby vynutila fit?	Plný EFT_BIN je podporován informačními kritérii.
Predikce LOO na vynechaných datech	Vysvětluje model pouze data, která už viděl?	Po vynechání jednoho GGL-binu model stále vykazuje silný generalizační výkon.
Promíchání RC-binů	Pochází uzavření ze skutečné mapy?	Uzavření po promíchání seskupení klesá, což podporuje závislost na mapě.

Obrázek R2 | Rozsah ΔlogL_total při skenu σ_int (větší je lepší).

Jak číst tento obrázek

Testuje, zda náskok EFT zůstává po změnách předpokládaného vnitřního rozptylu RC.

Obrázek R3 | Rozsah ΔlogL_total při skenu R_min (větší je lepší).

Jak číst tento obrázek

Testuje, zda výhoda EFT zůstává stabilní po oříznutí složitých centrálních oblastí.

Obrázek R4 | Rozsah ΔlogL_total při skenu cov-shrink (větší je lepší).

Jak číst tento obrázek

Testuje, zda je pořadí citlivé na změny zacházení s kovariancí slabého čočkování.

Obrázek R5 | Ablační žebřík EFT_BIN (AICc, menší je lepší).

Jak číst tento obrázek

Testuje, zda je plný EFT_BIN nutný pro vysvětlení dat, spíše než aby jen přidával zbytečné parametry.

Obrázek R6 | LOO: rozdělení log-věrohodnosti pro vynechané biny.

Jak číst tento obrázek

Testuje, zda má model stále predikční výkon na neviděných GGL-binech.

Obrázek R7 | Negativní kontrola: promíchaná mapa způsobuje jasný pokles středního logL_true uzavření.

Jak číst tento obrázek

Dále z pohledu středního logL_true ukazuje, že uzavření závisí na správném mapování napříč daty.

9 | P1A: proč je „více modelů DM v dodatku“ klíčovou opravou

Tato část se neptá: „Porazila EFT jen jednu minimální základnu DM_RAZOR?“ Ptá se, zda se závěry testu uzavření a společného fitu změní, když je základna DM posílena v nízkodimenzionálním, reprodukovatelném a jasně zaznamenaném registru parametrů (P1A). Jinými slovy, P1A má zmenšit námitku, že „byla zvolena jen příliš slabá základna DM“, a posunout diskusi k otázce, zda se chování uzavření stále liší pod souborem auditovatelných zesílení DM.

P1A není navržen tak, aby vyčerpal všechny možné způsoby modelování hal LambdaCDM, ani aby proměnil stranu DM ve vysokodimenzionální, neauditovatelný fitovač. Vybírá nízkodimenzionální, reprodukovatelná zesílení s jasným registrem parametrů: rozptyl koncentrace, adiabatická kontrakce, jádro zpětné vazby, hierarchický prior rozptylu c–M, jednoparametrový proxy jádra, nuisanci kalibrace smyku slabého čočkování a kombinovanou základní linii DM_STD.

Hlavní čtení P1A

Mezi třemi legacy větvemi přináší malé čisté zvýšení síly uzavření pouze feedback/core; SCAT a AC čistý zisk uzavření nepřinášejí.

DM_HIER_CMSCAT, DM_RAZOR_M a DM_CORE1P mají na sílu uzavření jen velmi malý účinek nebo nevykazují významné čisté zlepšení.

DM_STD může výrazně zlepšit společné logL, ale jeho síla uzavření klesá, což naznačuje, že zlepšuje hlavně flexibilitu společného fitu, nikoli přenosově-predikční sílu RC→GGL.

EFT_BIN si v tabulce B1 P1A stále udržuje vyšší sílu uzavření a výhodu společného fitu; základní tvrzení P1 by proto nemělo být redukováno na „porazil jen minimální DM_RAZOR“.

Obrázek B1 | Výsledková tabule P1A: uzavření a společné ΔlogL relativně k základně (větší je lepší).

Jak číst tento obrázek

Tento obrázek ukazuje výkon několika větví zesílení DM relativně k základně.

Jeho význam není „všechna DM je vyloučena“, ale toto: v rámci nízkodimenzionálních, auditovatelných zesílení DM vybraných P1A posílení DM neodstraňuje výhodu uzavření EFT_BIN.

10 | Proč na experimentu P1 záleží

10.1 Metodologický význam: klást „uzavření napříč sondami“ nad „fit jedné sondy“

Teorie v galaktickém měřítku se může snadno zaseknout na otázce, zda model dokáže fitovat určitou sadu rotačních křivek. P1 posouvá otázku o úroveň výš: dokážou parametry naučené z RC predikovat slabé čočkování bez přelaďování na GGL? Tím se P1 mění ze „soutěže ve fitování“ na „test přenosové predikce“.

10.2 Význam transparentnosti: brát řetězec reprodukovatelnosti jako součást výsledku

Jedním důležitým příspěvkem P1 je, že společně zveřejňuje data, tabulky a obrázky, běhové štítky, negativní kontroly, reprodukční balík a auditní řetězec. To je důležité pro podporovatele i kritiky: diskuse se může vracet ke stejným veřejným datům, stejné mapě, stejným skriptům a stejným metrikám, místo aby porovnávala slogany.

10.3 Fyzikální význam: silný zátěžový test pro směry „gravitace bez temné hmoty“

Ve směrech gravitace bez temné hmoty dokáže mnoho modelů vysvětlit určitou část rotačních křivek nebo RAR. Těžší úkol je zároveň projít odečty slabého čočkování a pod negativními kontrolami ukázat, že signál závisí na správné mapě. P1 je důležitý proto, že vkládá střední gravitační odezvu EFT do protokolu podobného externí zkoušce: RC je tréninkové pole, GGL je pole přenosu a shuffle je pole proti podvádění.

10.4 Je to důležitý experiment pro oblast „gravitace bez temné hmoty“?

Opatrně řečeno: pokud datové zpracování P1, reprodukční balík a protokol uzavření obstojí v externím posouzení, lze jej považovat za experiment uzavření RC+GGL, který stojí za vážnou pozornost ve směrech gravitace bez temné hmoty / modifikované gravitace. Jeho význam nespočívá ve sloganu „temná hmota byla vyvrácena“, ale v tom, že poskytuje kritérium napříč sondami, které lze replikovat, zpochybňovat a rozšiřovat.

Existují již rámce predikce–uzavření RC+GGL na stejné úrovni?

Existují relevantní rámce a pozorovací tradice: MOND/RAR dobře uspořádává mnoho jevů rotačních křivek; práce KiDS-1000 na RAR se slabým čočkováním také porovnávala MOND, Verlindeho emergentní gravitaci a modely LambdaCDM; LambdaCDM může také vysvětlit některé slabě čočkovací/dynamické jevy přes spojení galaxie–halo, plynová hala a modelování zpětné vazby.

Přesné tvrzení P1 však není, že „žádný jiný rámec na světě nedokáže vysvětlit RC+GGL“. Spíše platí, že pod vlastním veřejným protokolem P1 — pevná mapa, uzavření RC-only→GGL, negativní kontroly promícháním, registr parametrů a vícenásobné DM zátěžové testy P1A — hlásí EFT silnější výkon uzavření.

Jinými slovy, část P1, která nejvíce stojí za externí testování, je její konkrétní, reprodukovatelný srovnávací protokol. Velmi cenným dalším krokem je zjistit, zda MOND/RAR, LambdaCDM/HOD, hydrodynamické simulace nebo jiné rámce modifikované gravitace dokážou pod stejným protokolem dosáhnout stejných nebo vyšších skóre uzavření.

11 | Co může P1 uzavřít a co uzavřít nemůže?

Tabulka 3 | Hranice závěrů P1

Lze uzavřít	Pod daty RC+GGL, pevnou mapou a hlavním srovnávacím protokolem P1 má rodina EFT vyšší skóre společného fitu a sílu uzavření než minimální DM_RAZOR.
Lze uzavřít	V nízkodimenzionálním, auditovatelném rozsahu zesílení DM v P1A více zesílení DM neodstraňuje výhodu uzavření EFT_BIN.
Lze uzavřít	Negativní kontrola promícháním ukazuje, že signál uzavření závisí na správném mapování napříč daty a není dosažitelný pod libovolnými mapami.
Nelze uzavřít	Nelze říci, že P1 vyvrátila všechny modely temné hmoty. P1A stále nevyčerpává nesféricitu, environmentální závislost, složitá spojení galaxie–halo, vysokodimenzionální zpětnou vazbu ani úplné kosmologické simulace.
Nelze uzavřít	Nelze říci, že úplný rámec EFT byl prokázán z prvních principů. P1 testuje pouze fenomenologickou vrstvu střední gravitační odezvy.
Nelze uzavřít	Nelze říci, že byly vyloučeny všechny systematiky. P1 poskytuje důkazy robustnosti pouze v rámci uvedených zátěžových testů a rozsahu auditu.

12 | Časté otázky obecných čtenářů

Q1: Říká se tím, že „temná hmota neexistuje“?

Ne. Závěry P1 musí být omezeny na data, protokol a srovnávací modely použité zde. P1A přesahuje minimální DM_RAZOR, ale stále nereprezentuje všechny možné modely temné hmoty.

Q2: Říká se tím, že „EFT byla prokázána“?

Také ne. P1 testuje EFT jako parametrizaci střední gravitační odezvy a ukazuje silnější výkon v uzavření RC→GGL; mikroskopický mechanismus a úplná teorie nejsou závěrem P1.

Q3: Proč neuvést přímo významnost v σ?

P1 používá sjednocená skóre věrohodnosti, informační kritéria a rozdíly uzavření. ΔlogL je relativní výhoda pod stejným skórovacím pravidlem; není ekvivalentem jedné hodnoty σ.

Q4: Proč promíchávat RC-bin→GGL-bin?

Jde o negativní kontrolu. Skutečný signál napříč sondami má záviset na správné mapě; pokud by po promíchání zůstal stejně silný, naznačovalo by to spíše možnou implementační zaujatost nebo statisticky falešný signál.

Q5: Co by měla P1 udělat dále?

Rozšířit tentýž protokol na více dat, více srovnání DM, složitější systematiky a další rámce modifikované gravitace — zejména způsoby, které umožní externím týmům znovu testovat pod stejnou metrikou uzavření.

13 | Mini slovníček

Tabulka 4 | Mini slovníček

Termín	Vysvětlení jednou větou
Rotační křivka (RC)	Vztah poloměr–rychlost rotace v galaktickém disku, používaný k odvození efektivní gravitace uvnitř disku.
Slabé čočkování (GGL)	Míra průměrného gravitačního/hmotnostního rozložení kolem galaxií v popředí prostřednictvím statistického zkreslení tvarů galaxií v pozadí.
Test uzavření	Používá RC posterior k predikci GGL a poté jej porovnává s negativní kontrolou vytvořenou promíchanou mapou.
Negativní kontrola	Záměrně naruší klíčovou strukturu, aby se ověřilo, zda signál zmizí; používá se k vyloučení falešných signálů.
Halo NFW	Profil hustoty hala temné hmoty běžně používaný v modelech studené temné hmoty.
Vztah c–M	Vztah mezi koncentrací c hala temné hmoty a hmotností M; povolení rozptylu ovlivňuje flexibilitu modelu.
DM_STD	Standardizovaná zátěžová větev DM v P1A, která kombinuje několik nízkodimenzionálních zesílení DM a nuisanci čočkování.
ΔlogL	Rozdíl log-věrohodnosti mezi dvěma modely pod stejným skórovacím pravidlem; kladná hodnota znamená, že první je lepší.
Kovariance	Maticový popis korelací mezi datovými body; data slabého čočkování obvykle vyžadují plnou kovarianci.

14 | Doporučená cesta čtení a citační vstupy

1. Nejprve si přečtěte oddíly 0–2 tohoto průvodce, abyste ukotvili otázku P1 a záměrně zdrženlivou roli EFT v P1.

2. Poté si přečtěte obrázek S3, obrázek S4 a tabulky S1a/S1b, abyste porozuměli síle uzavření, společnému fitování a negativním kontrolám.

3. Pokud vás znepokojuje, že „základna DM je příliš slabá“, přejděte přímo k oddílu 9 a tabulce B1 / obrázku B1.

4. Pro technické ověření se vraťte k technické zprávě P1 v1.1, dodatku tabulek a obrázků a full_fit_runpack.

Hlavní vstupní body archivu

Technická zpráva P1 (úroveň vydání, Concept DOI): 10.5281/zenodo.18526334

Úplný reprodukční balík P1 (Concept DOI): 10.5281/zenodo.18526286

Strukturovaná znalostní báze EFT (volitelně, Concept DOI): 10.5281/zenodo.18853200

Poznámka k licenci: technická zpráva používá CC BY-NC-ND 4.0; úplný reprodukční balík používá CC BY 4.0 (za autoritativní zdroj považujte technickou zprávu a archivy Zenodo).

15 | Reference a externí pozadí

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.