8월, 2020의 게시물 표시

논문공부한거 | Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition

이미지
 Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition https://arxiv.org/pdf/2003.14111.pdf 읽는 이유: 그래프 컨벌루션의 개념과 SOTA 기술을 알아보기 위해 참고하면 좋은 블로그:  https://medium.com/bioai/graph-convolutional-networks-cf5d0f7b28d2  GCN 기본 개념에 대해 먼저 읽으면 좋다 Abstract 스켈레톤 기반 행동인식에서 spatial-temporal(공간-시간적?) graph 를 많이 쓴다. 그래프에서 robust한 패턴을 잡아내려면 feature 추출할 때  long-range(local에 대비되는 용어인 듯 하다) and multi-scale context aggregation and spatial-temporal dependency modeling이 중요하다. 현재 사용하는 방법의 한계점 (1) unbiased long-range joint relationship modeling under multiscale operators (2) unobstructed cross-spacetime information flow for capturing complex spatial-temporal dependencies 이 논문의 내용 (1) a simple method to disentangle multi-scale graph convolutions and  (2) a unified spatial-temporal graph convolutional operator named G3D 단어 뜻) aggregation: 집합, 종합 1. Introduction 이전의 (스켈레톤 기반 행동인식) 접근방식 : 관절간의 상관관계를 직접 설정 [42,43]하거나 러닝 [31,6,48,54]함 최근의 접근방식 [50,19,34,35,3...