그림3 - NVIDIA V100 GPU의 텐서 코어의 연산처리

D = (A0.0 ... A3.3)(B0.0 ... B3.3) + (C0.0 ... C3.3)

FP16 or FP32 = (FP16)(FP16) + (FP16 or FP32)