환자들은 수술 전 정확한 진단을 위해 필수적으로 의료 영상 정보를 수집한다. 이러한 정보는 볼륨 가시화와 같은 기술을 통해 특정 환부에 대한 상세 정보를 추출하는 데 중점을 두고 처리된다. 또한, 시뮬레이션 기술의 지속 적인 발전과 고령화 사회의 도래로 의료 시뮬레이션의 중요성이 점점 증가하고 있다. 다양한 변형체 알고리즘의 접근 중에서도, 3D 체인메일 알고리즘은 그 독특한 사슬 갑옷과 유사한 움직임을 모방하는 방식으로 주목받으며 발전을 거듭해왔다. 이 알고리즘의 진보된 형태인 HP(Heterogeneous Parallel)-체인메일은 GPU의 병렬 처리 능력을 활용하는 방식으로 구현되었다. 본 논문에서는 GPU 커널의 런치 비용에 대한 깊이 있는 분석을 바탕으로, CPU와 GPU에서의 반복을 통한 비용 절감 방안을 제안한다. 또한, HP- 체인메일에서 제시된 블록 구조가 가진 문제점을 분석하고, 이를 극복하기 위해 GPU에 최적화된 블록 크기의 제한을 도입한다. 이에 따라 제한된 블록 크기는 GPU의 공유 메모리를 최대한 활용하여 성능을 극대화한다. 본 논문은 제안하는 방법들을 통해 GPU 최적화된 3D 체인메일 알고리즘을 개선하여, 더욱 신속하고 사실적인 의료 시뮬레이션을 가능케 하는 새로운 지평을 열었다.