본문으로 건너뛰기
홈 › 시리즈 › MediaPipe Face Landmarker — 학부생을 위한 학습 교재 › 용어집
용어집 · MediaPipe Face Landmarker — 학부생을 위한 학습 교재
A
ARKit 52
Apple의 52 블렌드셰이프 표준. MediaPipe 52와 51개가 공통(차이는 _neutral/tongueOut).
Attention Mesh
눈·입술·홍채 영역에 어텐션을 줘 그 부위를 더 정밀하게 다듬는 region refinement 모델. 레거시 refine_landmarks가 켜던 동작이며 현행 Landmarker는 항상 적용한다. , 02장 §2.2 (d)
B
BlazeFace
모바일용 초경량 얼굴 검출기. Face Landmarker의 검출 단계(short-range). , 01장 §1.4
C
canonical face model(표준 얼굴 모델)
미리 만들어 둔 표준 3D 얼굴 메시(정점 468개). 모든 얼굴을 맞춰 보는 기준 틀로, UV·삼각형 연결을 고정으로 물려준다. , 03장 §3.2
D
delegate (CPU/GPU)
추론을 어느 백엔드로 돌릴지 선택. "GPU=무조건 빠름"은 틀린 일반화다.
detect-once-then-track
첫 프레임만 검출기를 돌리고, 이후엔 직전 ROI를 재사용해 검출기를 건너뛰는 전략. 실시간 성능과 정확도를 함께 끌어올린다. , 07장 §7.2
F
FACS (Facial Action Coding System)
얼굴 동작 부호화 체계. ARKit 52와 느슨히 대응한다.
float16
숫자를 16비트로 저장. 작고 빠른 모바일용.
G
GHUM (Blendshapes GHUM)
52 블렌드셰이프 예측 모델의 근간 논문(arXiv:2309.05782). MediaPipe Blendshape V2의 실체로 본다. , 04장 §4.4
I
IOD MAE
안구간 거리로 정규화한 평균 절대 오차. 메시(랜드마크) 모델의 정확도 지표(2.62% tracking / 3.24% reacquisition).
M
MLP-Mixer
Blendshape V2의 아키텍처(all-MLP). 이미지가 아니라 랜드마크 토큰을 처리한다.
MNE (Mean Normalized Error)
블렌드셰이프 모델의 정확도 지표(3.88%). IOD MAE와 별개 지표다. , 06장 §6.7
P
presence confidence (얼굴 존재 신뢰도)
랜드마크 단계에서 얼굴이 여전히 존재한다고 인정할 최소 신뢰도(메시 모델의 presence flag). 옵션 minfacepresence_confidence, 기본 0.5. 검출과 추적 사이의 게이트로, 떨어지면 이번 프레임 결과를 무효화해 재검출을 유도한다. , 06장 §6.4
R
ROI (Region of Interest)
잘라서 똑바로 세운 얼굴 패치(crop + align). 메시 모델의 입력이다. , 02장 §2.2 (c)
running_mode (IMAGE / VIDEO / LIVE_STREAM)
Face Landmarker의 세 실행 모드. , 06장 §6.3
T
Tasks API
현행 MediaPipe 비전 태스크 프레임워크(레거시 Solutions의 후속). , 05장 §5.2
tragion (트라기온)
귀 앞 연골 돌기, 곧 귀 부착점. BlazeFace 6키포인트 중 좌/우 눈 tragion으로 양 귀 기준점을 가리키며, ROI 정렬의 회전·스케일 기준 재료가 된다.
계
계보(lineage)
한 기술이 어떤 선행 기술 위에 쌓였는지의 의존 관계.
고
고정 토폴로지(fixed topology)
같은 번호의 점이 늘 같은 부위를 가리키는 성질. 프레임이 바뀌어도 추적·텍스처·리깅이 안정적이다. , 03장 §3.2
랜
랜드마크(landmark) / feature
얼굴 위의 의미 있는 한 점(좌표). 이 책에서 feature와 같은 뜻. , 03장
메
메시(face mesh)
랜드마크들을 삼각형으로 이어 만든 얼굴 표면 그물(연결 구조 포함). "Face Mesh"는 옛 레거시 솔루션 이름이자 Face Landmarker 번들 안의 한 모델 이름이기도 하다(두 층위). , 05장 §5.2
모
모프 타깃(morph target)
블렌드셰이프의 그래픽스 원조. 기본 표정 모양들을 가중합해 표정을 합성하는 기법.
번
번들(.task bundle)
모델 3종(tflite) + 그래프·메타데이터를 한 파일에 담은 것. face_landmarker.task, 약 3.58 MiB. , 06장 §6.2
변
변환 행렬(facial transformation matrix, 4×4)
머리의 자세(회전·이동·스케일)를 담는 4×4 행렬. 표정과는 다른 정보. , 04장 §4.5
블
블렌드셰이프(blendshape)
표정을 52개 "표정 단위 강도(0~1)"로 표현. 랜드마크를 입력받는 별도 2차 모델이 회귀한다. , 04장 §4.1
얼
얼굴 검출(face detection)
얼굴이 "어디 있는지"를 박스 + 키포인트로 찾기. , 02장 §2.2 (b)
역
역정규화(de-normalization)
ROI 패치 기준 좌표를 원본 이미지 기준 0~1 좌표로 되돌리는 후처리. (c)에서 저장한 ROI 변환을 거꾸로 적용한다.
온
온디바이스 추론(on-device inference)
서버 없이 사용자 기기 안에서 모델을 돌리는 것. 빠르고 프라이빗하다.
정
정규화 좌표(normalized coordinate)
좌표를 이미지 크기로 나눠 0~1로 만든 값. 해상도와 무관하다. , 03장 §3.6
추
추적(tracking) / 재획득(reacquisition)
직전 프레임 정보로 검출기를 건너뛰는 것(추적) / 처음부터 다시 찾는 것(재획득).
테
테셀레이션(tessellation)
얼굴 안쪽을 메우는 채움 삼각형·점. 영역 윤곽 점수에는 포함하지 않는다.
토
토폴로지(topology)
점들의 순서·연결 구조. , 03장 §3.2
표
표정 계수(coefficient)
한 블렌드셰이프 단위의 활성화 강도(0~1). , 04장 §4.1
픽
픽셀(pixel)
이미지의 가장 작은 칸. RGB는 칸마다 (빨강·초록·파랑) 값을 가진다.
홍
홍채(iris)
눈동자의 색 있는 둥근 부분. 478의 "+10" 출처(눈당 5점). , 03장 §3.3
회
회귀(regression)
범주가 아니라 연속적인 숫자 값을 직접 예측하는 것(좌표·계수).
4
478 / 468
출력 랜드마크 수. 478 = 표면 메시 468(인덱스 0–467) + 홍채 10(인덱스 468–477). 레거시 Face Mesh는 기본 468, refine_landmarks=True로 478이었다.
5
52 (두 개의 52)
MediaPipe 52와 ARKit 52는 개수만 같고 집합이 다르다. 51개는 공통, MediaPipe는 _neutral 포함·tongueOut 제외, ARKit은 반대다.