close

Вход

Забыли?

вход по аккаунту

код для вставкиСкачать
Лекция 8
Основные темы лекции.
Систематические погрешности. Методы вычисления систематических
погрешностей. Систематические погрешности в частотном подходе.
Учёт систематических погрешностей в Байесовском подходе.
При измерении числа событий, распределённых по Пуассону,
получили 3 события. Оценка фона даёт 4 события. Как получить
верхний предел для сигнала, соответствующий a = 0.05. Предполагается,
что l = lb + ls (фон+сигнал), метод расчёта – Байесовский, приор –
константа.
При измерении числа событий, распределённых по Пуассону,
получили 3 события. Оценка фона даёт 4 события. Как получить
верхний предел для сигнала, соответствующий a = 0.05. Предполагается,
что m = mb + ms (фон+сигнал), метод расчёта – Байесовский, приор –
константа.
P (n | m) =
mn e- m
n!
P (m | 3) =
m3 e- m
3!
mb = 4
m = 4+ ms
После перенормировки на 1 области > 4, можно вычислить область для
которой интеграл равен 95% от новой области. Ответ: S < 4.97 @ 95% CL.
mb = 4
Как вычисляется систематическая погрешность?
1. Какой физический параметр (величина) на самом деле вычисляется ?
(Это очень важный вопрос, вернусь позднее).
2. Какая величина получается из статистического анализа данных?
3. Какие параметры используются для вычисления физического
параметра на основе статистически полученной величины?
Пример:
− +
0
B (B0
s → Ds p ) = Nsig (events) / [ N(Bs ) x
e]
ВСЕ параметры из пункта 3 (и не только они) должны быть
проверены на наличие систематической погрешности.
Оценка систематической погрешности требует определённого
опыта и изобретательности.
В качестве примера приведу формулу вычисления относительной
вероятности канала распада B0
s мезона :
− +
0
B (B0
s → Ds p ) = Nsig (events) / [ N(Bs ) x
e]
1. N sig – при получении этой
величины использовались:
а) форма фона
б) форма сигнала
в) биннинг (на самом деле нет)
г) область подгонки
N sig
2. N(B0
s ) - при определении использовали светимость, сечение,
∗
∗
доля B0
s , доля канала с Bs Bs .
3. e - эффективность. Включает эффективность реконструкции треков,
фотонов; эффективность идентификации заряженных частиц,
МС статистика, знание отн. вер. распада Ds , эффективность отборов.
В качестве примера приведу формулу вычисления относительной
вероятности канала распада B0
s мезона :
− +
0
B (B0
s → Ds p ) = Nsig (events) / [ N(Bs ) x e ]
Источник систематики
Погрешность, %
Интегральная светимость
1.3
Сечение s (е+е- → )
4.6
(∗) (∗)
Доля fs ( → Bs Bs )
Доля f ( B∗s B∗s )
13.3 - 15.0
4.1 - 4.8
Относительная вероятность распадов D−
s
5.9 - 6.8
Эффективность (Монте Карло статистика)
1.2 - 2.3
Эффективность отборов
2.0 - 4.8
Идентификация заряженных p± и K±
5.4
Эффективность реконструкции трека
4.0
Эффективность реконструкции g и p0
5.4 - 8.8
Формы сигналов при подгонке
2.7 - 4.7
Сумма всех источников (суммируется квадратично)
17.7, 20.8, 19.7, 20.7, 18.6
Какие методы используются (обычно) ? Как получить систематическую
погрешность?
1. Из данных (sidebands, подобные или другие процессы). Этот
подход считается наиболее точным. Характерно, что полученные
оценки являются статистическими и эти систематические погрешности
могут снижаться при увеличении статистики.
2. Из Монте Карло моделирования. Не столь надёжные оценки (по
сравнению с предыдущим пунктом), зато МС статистика не ограничена.
К этим статистическим погрешностям относятся инструментальные
неопределённости (хотя часть из них оценивается по 1 методу), обычно
отражающие эффективность регистрации. Часть фоновых процессов
также оценивается из МС.
3. Теоретические неопределённости.
Часть систематических погрешностей снижается с ростом статистики,
а часть нет. Существует неснижаемая константа. Однако при переходе к
новым более эффективным методам базовая систематика может снизиться.
В классическом частотном подходе предполагается, что все
систематические погрешности распределены по нормальному
распределению и, соответственно, их можно складывать
квадратично, чтобы получить полную систематическую погрешность.
s tot (syst) =

s i2
- для некоррелированных сист. погрешностей
Если погрешности коррелированы, то их нельзя складывать
квадратично. Полностью коррелированные погрешности
складываются (или вычитаются) линейно, а частично коррелированные складываются с учётом корреляции.
V = X ± s (stat) ± s (syst)
- частотный подход
Полная погрешность измерения вычисляется как сумма квадратов
статистической и систематической погрешности. При этом можно
получить значимость сигнала с учётом также и систематической
погрешности (надо быть внимательным, если систематическая
погрешность определена в процентах от сигнала).
Систематические погрешности (если они правильно определены)
такие же реальные, как и статистические. Это такая же реальная
неопределённость в знании теоретического параметра.
В Байесовском подходе все дополнительные параметры (те, которые
дают систематику, в литературе называют также несущественные
параметры или nuisance parameters) нужно учитывать.
Если известен приор для дополнительных параметров n (их функция
плотности вероятности) , то по ним просто интегрируется общая функция
плотности вероятности для получения усреднённой PDF:
Pav (x | q) =
+∞

−∞
( x | q, n ) p (n) d n
При этом полученную PDF (называют marginal likelihood) используют как
в Байесовском подходе, так и в частотном подходе (смешанный подход).
В Байесовском подходе естественно интегрировать по дополнительным
параметрам постериорную функцию плотности вероятности:
P (q | x) =
+∞
 ( q, n
−∞
| x) d n
При наличии большого числа дополнительных параметров по ним
интегрируют методом Монте Карло. Затем из PDF получают
доверительные интервалы. Хороший метод получения верхнего предела.
Задача. При измерении числа событий, распределённых по Пуассону,
получили 8 событий. Оценка фона даёт 4±1 события. Как получить
постериорную функцию плотности вероятности от ms. Предполагается,
что m = mb + ms (фон+сигнал), метод расчёта – Байесовский, приор –
константа (кроме оценки фона).
Задача. При измерении числа событий, распределённых по Пуассону,
получили 8 событий. Оценка фона даёт 4±1 события. Как получить
постериорную функцию плотности вероятности от ms. Предполагается,
что m = mb + ms (фон+сигнал), метод расчёта – Байесовский, приор –
константа (кроме оценки фона).
P (m | 8) =
n!
m8 e- m
8!
b=4±1
P (n | m) =
mn e- m
b=4±1
Постериорная PDF:
P (m | 8) =
m8 e- m
8!
G(m b | 4;1)
x
G(m b | 4;1)
где m = mb + ms
P (ms | x) =
+∞
 ( ms, mb
−∞
| x) d mb
b=4±1
Нужно получить свёртку:
В результате интегрирования получена несколько более широкая
функция PDF. Отрезав левую часть m < 4, и сместив функцию на
4 единицы влево получим финальную PDF для ms .
Эту функцию можно
использовать для
получения доверительного
интервала.
Последний на сегодня вопрос:
Что лучше, измерять физически важные величины (для сравнения
с теорией), которые имеют несколько дополнительных параметров,
вносящих систематику (модельные зависимости)
или измерять напрямую измеряемые параметры (мало дополнительной
систематики) и пусть теоретики пересчитывают полученные значения
для своих целей. Зато в будущем систематика снизится и наши
значения в сравнении с теорией станут “точнее”.
1/--страниц
Пожаловаться на содержимое документа