Найти Π² Π”Π·Π΅Π½Π΅
10,3 тыс подписчиков

🌟 ICRT : ВнутриконтСкстноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΈΠΌΠΈΡ‚Π°Ρ†ΠΈΠΈ дСйствия с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ прСдсказания ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ Ρ‚ΠΎΠΊΠ΅Π½Π°.


In-Context Robot Transformer (ICRT) - модСль, которая позволяСт Ρ€ΠΎΠ±ΠΎΡ‚Ρƒ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ Π½ΠΎΠ²Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ, интСрпрСтируя ΠΊΠΎΠ½Ρ‚Π΅ΠΊΡΡ‚Π½ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ, ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»Π΅Π½Π½ΡƒΡŽ Π²ΠΎ врСмя дСмонстрационной Ρ„Π°Π·Ρ‹, Π±Π΅Π· обновлСния ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ.

ICRT прСдставляСт собой ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π½ΠΎ-слСдствСнный трансформСр, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ выполняСт автоматичСский ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· сСнсомоторных Ρ‚Ρ€Π°Π΅ΠΊΡ‚ΠΎΡ€ΠΈΠΉ Π±Π΅Π· использования лингвистичСских Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ вознаграТдСния. Он позволяСт Π³ΠΈΠ±ΠΊΠΎ ΠΈ Π±Π΅Π· обучСния Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ Π½ΠΎΠ²Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ Π½Π° основС наблюдСний ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, дСйствий ΠΈ состояний, собранных с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Π΅Π»Π΅ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΉ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°.

МодСль состоит ΠΈΠ· Ρ‚Ρ€Π΅Ρ… частСй: ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½Π½ΠΎΠ³ΠΎ ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊΠ° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, сСрии ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π°Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΠΈ ΠΊΠ°ΡƒΠ·Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ трансформСра:

πŸŸ ΠšΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ Ρ€Π°Π·Π½ΠΎΠΏΠ»Π°Π½ΠΎΠ²Ρ‹Π΅ наблюдСния Ρ‡Π΅Ρ€Π΅Π· трансформСр, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π±Ρ‹Π» ΠΎΠ±ΡƒΡ‡Π΅Π½ Π½Π° смСси Π΄Π°Π½Π½Ρ‹Ρ… ImageNet ΠΈ Open X-Embodiment

πŸŸ ΠŸΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΡ€Ρ‹ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΡŽΡ‚ наблюдСния, состояниС Ρ€ΠΎΠ±ΠΎΡ‚Π° ΠΈ дСйствия Π² ΠΎΠ±Ρ‰Π΅Π΅ Π»Π°Ρ‚Π΅Π½Ρ‚Π½ΠΎΠ΅ пространство для ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ модСлирования

πŸŸ Π’Ρ€Π°Π½ΡΡ„ΠΎΡ€ΠΌΠ΅Ρ€ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π½Π° Π²Ρ…ΠΎΠ΄ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ², ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΡ… состояниС Ρ€ΠΎΠ±ΠΎΡ‚Π° ΠΈ дСйствия, ΠΈ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ для управлСния Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠΌ.

Для ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ использовался датасСт DROID ΠΈ созданный Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠ·Π°Π΄Π°Ρ‡Π½Ρ‹ΠΉ датасСт ICRT-Multi-Task (ICRT-MT - 1098 Ρ‚Ρ€Π°Π΅ΠΊΡ‚ΠΎΡ€ΠΈΠΉ, 26 Π·Π°Π΄Π°Ρ‡ с 6 ΠΏΡ€ΠΈΠΌΠΈΡ‚ΠΈΠ²Π°ΠΌΠΈ), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ использовался Π² этапС дообучСния.

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ экспСримСнтов ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ ICRT способСн ΠΎΠ±ΠΎΠ±Ρ‰Π°Ρ‚ΡŒ Π½Π΅Π·Π½Π°ΠΊΠΎΠΌΡ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ ΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹, Π΄Π°ΠΆΠ΅ Π² срСдах, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ ΠΎΡ‚ дСмонстрационных.

▢️Установка:

# Create & activate venv
conda create -n icrt python=3.10 -y
conda activate icrt

# Install torch
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
conda install -c conda-forge ffmpeg

# Clone the Repository
git clone https://github.com/Max-Fu/icrt.git
cd icrt

# Install required packages
pip install -e .

# Install git-lfs
sudo apt install git-lfs
git lfs install

# Download checkpoints
git clone git@hf.co:mlfu7/ICRT checkpoints

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ инфСрСнса ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ Π² Π½ΠΎΡƒΡ‚Π±ΡƒΠΊΠ΅ inference.ipynb. ΠŸΠ΅Ρ€Π΅Π΄ Π΅Π³ΠΎ запуском ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ·Π½Π°ΠΊΠΎΠΌΡŒΡ‚Π΅ΡΡŒ с рСкомСндациями ΠΏΠΎ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ΅ ΠΈ созданию собствСнного датасСта.

πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ : Apache 2.0 License.

🟑Arxiv
🟑Dataset
πŸ–₯Github


#AI #ML #Robotics #ICRT
Π’ этом постС Π΅ΡΡ‚ΡŒ большоС Π²ΠΈΠ΄Π΅ΠΎ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π½Π΅ Π·Π°Π³Ρ€ΡƒΠ·ΠΈΠ»ΠΎΡΡŒ Π² Π”Π·Π΅Π½. ΠžΡ‚ΠΊΡ€ΠΎΠΉΡ‚Π΅ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π» поста Π² Ρ‚Π΅Π»Π΅Π³Ρ€Π°ΠΌΠ΅, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΅Π³ΠΎ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ
2 ΠΌΠΈΠ½ΡƒΡ‚Ρ‹