詳解確率ロボティクス勉強会(木曜日)
2021/03/04
この式から始まった。 まだ、しっかり言葉で説明できない。
σ2は分散である。
分散が大きいというのは、データとデータが互いに離れていること。
分散には、標本分散と不偏分散がある。
論文には、不偏分散を使う。標本分散だとデータが少ないときに有利になる恐れがあるため。
標準偏差は、分散の正の平方根であり、誤差を表すのに便利である。
観測データの単位とそろえる必要があるため、観測データの誤差を表す際には、分散ではなく標準偏差を用いる。
2021/03/011
±4.8は誤差の範囲を示しているものであり標準偏差である。
標準偏差は、誤差を直感的に伝えるのに便利である。
また、±4.8に含まれるはデータは総データのうち70%含まれている。
2021/03/18
確率 = 相対頻度
「確率変数」は、ある変数の値をとる確率が存在する変数。(ex.さいころの出る目、ライダーの観測値)(離散型)
「確率分布」は、確率変数がとる値とその値をとる確率の対応を表したもの。
「確率質量関数」は、離散型確率変数Xがある値xをとる確率を関数f(x)としたもの。(P(x)のことだと思っていた)
ドロー(確率分布から値を選ぶ)は、個々のものを抽出、サンプリングは、ある母集団に対して集団の一部を抽出。
例)ガウス分布はセンサの値zがa以上b未満に入る確率を表したもの。
2021/03/25
何かのexp(エクスポネンシャル)に係数をかけたものである。係数は1に分散をルートでとった値で割った値でexpは観測値から平均を引いた値に分散を割った値。
実数は∞個ある。
積分には種類があり、リーマン積分とルベーグ積分がある。 リーマン積分は区間上で考えるもので、ルベーグ積分は分布上で考えるものである。
2021/04/01
2021/04/08
2021/04/15
期待値とかの話しをしてたと思う。
awsで忙しくてまともにやれてなかった。
2021/05/13
また、2章の最初に戻ってしまった。
amazonで売られている統計の教科書と併用して、再度詳解確率ロボティクスの勉強をすることになった。
センサから得られた全データの性質を調べるために、グラフや図を用いる。
中でもヒストグラムが良く用いられる。 ヒストグラムを用いることでデータの性質を知ることができる。 たとえば、横軸のデータの範囲に対する平均値の位置や、データのばらつき、ヒストグラムの形状、ハズレ値があるか、峰がいくつあるか。
ガウス分布の性質について
- 平均値と最頻値と中央値が一致する。
- 平均値を中心にして左右対称である。
- x軸が漸近線である
- 分散(標準偏差)が大きくなると、曲線の山は低くなり、左右に広がって平らになる。分散(標準偏差)が小さくなると、山は高くなり、よりとんがった形になる。
2021/5/20
院面接のため、お休み
2021/5/27
サンプルデータが少ない場合は不偏分散を使わないと正確な値にならない。
分散を用いることで分布同士の足し算が可能になる。
分散と偏差平均の違いは、分散の方が対象データが平均から遠いほど大きな値になること。
2次元の分布の場合、一次元の分布と比べてシグマからデータが外れる。 変数が増えるほど、1シグマ辺りのデータの割合が小さくなる。
モードは分布がいくつあるかを見るときに便利である。 たとえば、パーティクルの塊が3つに分かれていれば分布は3つある。 複数モードが存在していることを、マルチモードという。
2021/6/3-10-17
共分散 楕円の長軸の傾き
センサーのデータを地味に記録し解析することは(記述統計)センサーがどれだけ正確なのかを調べるために行うことである。
事象 確率を与える条件
根源事象 全事象における最小単位の出来事である要素 偶数→2、4 etc...
排反事象 各事象が同時に起こらないような事象 偶数↔奇数
確率変数 関数が受け付ける数 p(x) 各事象による確率により、ある値を取る変数
連続型確率分布から確率を求める場合、積分が必要 範囲を持たせずある一点で確率を求めると、全て確率が0になってしまう