- ZED2iのステレオ計算が場合によって弱点を持っている。
- depth-anything はつじつまのあったdepthの解釈には長けているように見える。
- Depth Rangeの下限以下だと、欠損点になる。
- 左右のカメラで対応点がとれない箇所が、欠損点になる。
- 特に左カメラでしか見えていない領域はsl.DEPTH_MODE.ULTRA では欠損値になる。
- このため近接側の限界値を超えた近接側で、物体を見つけることができない。
- 透明物体に対する深度が、間違った値となる。
- 順序が安定しているdepth(深度情報)がとれること。
- 深度の絶対値は期待しない。
- segment-anything レベルでの解像度は期待しない。
- ZED SDK 環境でデータを取得できるので、depth_anything の結果とZED SDK でのdepthとを直接比較できる。
- Depth-Anythingの場合だと、近すぎる対象物でも距離が算出される。
- 遠すぎる対象物でも、それなりの値が算出される。欠損値とはならない。
- 照度差ステレオがある。
- 物体表面の輝度値をもとに物体表面の法線の向きを算出
- それらの情報を組み合せて物体の形状が算出できる。
- それら照度差ステレオでできていたことが、単眼deph計算が可能な裏付けになっている。
- ステレオカメラでは、左画像の画素位置を基準に深度情報を計算するのが標準になっている。
- 単眼depth計算には、左カメラ画像を用いる。
- ZED SDK のdepthのうち、近すぎてdepthが出ない領域を表示すること
- その領域に対してdepth-anything のdepthを表示させること。
- zed-sdkで値が求まっているpixel について、両者の相関関係を確認すること。
- 期待すること: 1次式の関係にあること。
- それが何%の誤差になるのか
- pointCloud への変換の確認方法
- 球が球として計測できるか。
- スケーリングの妥当性を確認できているか?
- カメラ解像度と推論のための解像度の違いの扱いが妥当になっているか?
- focal_length_x, focal_length_y の値との関連はどうか
- depth_anything を使ってdepthの値の絶対値を気にしている例はどれくらいあるのか?
- depth_anything での平面の平面性はどんなであるか
- 数値としてのdepthを点群データに変換して妥当性を確認しやすくすること
- 以下のissue を読むと点群データへの変換と可視化の例が記されている。 LiheYoung/Depth-Anything#36
[2024-07-03 07:30:13 UTC][ZED][INFO] Logging level INFO
INVALID RESOLUTION
[2024-07-03 07:30:14 UTC][ZED][WARNING] INVALID RESOLUTION in sl::ERROR_CODE sl::Camera::open(sl::InitParameters)
[2024-07-03 07:30:14 UTC][ZED][ERROR] [ZED] sl::Camera::Open has not been called, no Camera instance running.
[2024-07-03 07:30:14 UTC][ZED][ERROR] [ZED] sl::Camera::Open has not been called, no Camera instance running.
- open3dで十分なことに対して、自前ライブラリを使わなくする。
- depth2anythingとzed-sdk とでのフィッティングの残差
- マジックナンバーを減らすこと
- フィッティングを行うサンプリングを1フレームよりも増やすこと
- そうすることで、対応点のとれる距離の範囲を広範囲にすること
- 推測 物体の輪郭に生じるartifact 細いことで、ブロックマッチングで対応がとれにくい領域 fittingの定義域の外 透明物体
エラーを表示しても、スクリプトは継続する。
[07/03/2024-07:37:30] [TRT] [E] 1: [resizeRunner.cpp::execute::89] Error Code 1: Cuda Runtime (invalid resource handle)
TRT を利用しているコード側の以下の改変で解決した。 katsunori-waragai/depth-anything-zed#16
- ステレオ計測:
- ポスターがあったら、ポスターの貼られている平面あるいは曲面を返すのを期待する。
- Depth-anything:
- ポスターがあったら、ポスターに写っている内容を奥行きがあると解釈して結果を返す。
- そのため、絵に対しても奥行きを解釈することがある。
- ヒトを含む動物の意識については受動意識仮説がある。
- 複数のセンサからの入力値から、それぞれの推論をした結果、ある時刻の状況について、全てのセンサでの推論が出そろうのは、ある程度の時間が立った後である。(確定した時系列データ)
- この手法の状況においては、それぞれのセンサの推論が発生した時刻が実は違っているという問題は生じない。
- あたかも、情報は瞬時に出そろっていて、知覚に時間遅れを含んでいないように見える。
- 因果的な時系列の状況もつじつまがあっている。
- 知覚処理には、既にある程度の時間遅れを含んでいる。そのため、出そろわない情報の中で判断して、次の行動を起こしている。
- その行動を起こした時刻と、その結果が意識にあがる時刻とは異なっているらしい。
- にもかかわらず、意識的に行動を決定したという具合に思っているらしい。
- 人間は光や音を感じるより前に遡ってタイミングを知覚している
Beyond perceptual modality: Auditory effects on visual perception
聴覚刺激による視覚知覚の変調に関する3つの新知見について概説する。第一に、聴覚刺激と視覚刺激の間の順序と遅延によって、視覚の時間分解能は随伴音によって改善されたり悪化したりする。第2に、1つの視覚的閃光は、複数の音を伴うと複数の閃光として知覚される。第三に、2つの物体が互いに向かって移動する曖昧な運動ディスプレイは、非同期音の有無にかかわらずストリーミングとして知覚されるが、同期音の有無にかかわらずバウンシングとして知覚される。これらの知見に基づき、我々は、視覚優位の伝統的な考え方に反して、聴覚は、特に強い一過性の信号を提供する場合に、視覚を修正することができると主張する。
Abstract の機械翻訳による訳