저는 여가 시간에 좋은 책을 읽는 것을 좋아합니다. 특히 좋은 커피 한 잔을 손에 들고 읽는 것을 좋아합니다. 특히 서점을 돌아다니며 책장을 훑어보고 예상치 못한 책을 발견하는 것을 좋아합니다. 그러던 어느 날, 제 눈길을 사로잡은 책이 있었습니다. 바로 아자이 아그라왈, 조슈아 간스, 그리고 아비 골드파브가 쓴 『예측 기계』 입니다.
솔직히 말해서, 요즘 AI/ML에 조금이라도 관심이 없는 사람이 한 명이라도 있을까요? 저자들은 책에서 "AI의 간단한 경제학과 포인트 솔루션에 이 기술이 어떻게 사용되는지"를 설명합니다 . 책의 한 장에서 저는 다음과 같은 부분이 특히 인상 깊었습니다.
더 나은 예측은 다양한 행동의 보상을 고려할 수 있는 더 많은 기회, 다시 말해 판단할 수 있는 더 많은 기회를 제공합니다. 즉, 더 좋고, 더 빠르고, 더 저렴한 예측을 통해 우리는 더 많은 결정을 내릴 수 있게 됩니다.
이 책은 AI와 머신러닝에 초점을 맞추고 있지만, 엔지니어링 시뮬레이션, 특히 CFD 분야에도 동일한 개념이 적용되므로 이 인용구가 저에게는 공감을 불러일으켰습니다. 시뮬레이션 목적과 관계없이 엔지니어에게는 더 빠르고 정보에 기반한 설계 결정을 내리는 능력이 매우 중요합니다. 혁신과 경쟁력 유지에 대한 압박은 생산성 향상과 시뮬레이션 워크플로우 가속화의 필요성을 더욱 심화시킬 뿐입니다.
엔지니어들이 최대한 많은 물리적 사실성과 기하학적 디테일을 포함하기를 원함에 따라, 점점 더 복잡해지는 고충실도 디지털 트윈을 생성해야 할 필요성이 더욱 커졌습니다. 따라서 빠른 메싱은 경쟁 우위를 확보할 수 있는 전략적 요소이며, 엔지니어가 제품 개발을 가속화하고 제품 출시 기간을 단축할 수 있도록 지원합니다. 이를 위해 당사는 CFD 워크플로우를 가속화하여 다양한 설계 변형을 신속하게 평가할 수 있는 솔루션을 개발하기 위해 최선을 다하고 있습니다. 메싱의 경우, 개별 워크플로우 최적화부터 MPI(Message Passing Interface) 분산 메모리 병렬화, 즉 여러 CPU에서 동시에 메싱 작업을 실행할 수 있는 기능까지 모든 것이 포함될 수 있습니다.
이 블로그에서는 Simcenter STAR-CCM+의 최근 개선 사항을 통해 메싱 성능이 어떻게 향상되었는지 살펴보겠습니다. 이를 통해 엔지니어는 시뮬레이션 처리량을 늘리고 더 빠르게 통찰력을 얻을 수 있게 되었습니다.
MPI 표면 래핑으로 지오메트리 정리 가속화
Simcenter STAR-CCM+의 주요 차별화 요소 중 하나는 엔지니어가 복잡한 지오메트리를 처리할 수 있도록 CAD에서 솔루션으로 이어지는 파이프라인 워크플로입니다. 많은 시뮬레이션 워크플로에는 수만 개의 부품으로 구성된 거대한 CAD 어셈블리가 포함됩니다. 이러한 CAD 파일에는 매우 큰 어셈블리와 "더티" 지오메트리가 포함되는 경우가 많습니다. "더티"란 구멍, 교차점, 디피처링(defeaturing)이 필요하거나, 겹치는 부분이 있거나, 비다양체 정점이나 모서리가 있는 입력 지오메트리를 의미합니다. 이러한 지오메트리를 수동으로 정리하고 복구하는 것은 노동 집약적인 작업으로, 완료하는 데 며칠 또는 몇 주가 걸릴 수 있습니다.
Simcenter STAR-CCM+에서 메싱을 위한 지오메트리를 준비하는 핵심 도구 중 하나는 Surface Wrapper입니다. Surface Wrapper는 임의의 복잡한 CAD 또는 테셀레이션된 부품을 가져와서 완벽한 매니폴드 표면을 생성할 수 있습니다. 이 기능은 고품질 삼각형 표면 메시를 이산화된 지오메트리에 효과적으로 "수축 래핑(shrink-wrapping)"하는 방식으로 작동합니다. 주요 장점 중 하나는 날카로운 모서리나 모서리와 같은 지오메트리 특징을 정확하게 보존하는 기능입니다. Simcenter STAR-CCM+ 버전 2310에서는 Surface Wrapper의 최초의 MPI 병렬화 버전을 도입하여 "레거시 래퍼"라고도 하는 공유 메모리 병렬 버전에 비해 상당한 성능 향상을 제공했습니다. 이 첫 번째 버전에서는 레거시 래퍼에 비해 래핑 시간이 최대 43% 단축되었습니다.

하지만 이러한 성능 향상은 대규모 사례에는 충분하지 않습니다. 지속적인 개선에 대한 저희의 노력에 따라 Simcenter STAR-CCM+ 2510 버전에서 MPI Surface Wrapper 2단계를 출시합니다. 성능 향상 내용을 살펴보겠습니다.

그림 2에서 볼 수 있듯이, 버전 2510의 MPI Surface Wrapper는 버전 2506(MPI Surface Wrapper 1단계)에 비해 최대 2배 빠른 성능을 제공합니다. 레거시 Wrapper와 비교했을 때 속도 향상은 최대 5.6배에 달합니다. 총 볼륨 메시 수가 9,300만 셀인 코르벳 자동차와 같은 복잡한 지오메트리의 경우, 32개 코어(Intel® Xeon® Gold 6442Y)에서 전체 지오메트리를 래핑하는 데 6.5분밖에 걸리지 않습니다.

더 큰 케이스를 래핑하는 것은 어떨까요? 코르벳 케이스의 경우, 서피스 래퍼는 3,740만 개의 표면 삼각형을 생성합니다. 이와 대조적으로, 아래 그림과 같이 마세라티 기블리 케이스는 훨씬 더 커서 5,630만 개의 삼각형으로 래핑하는 데 9분밖에 걸리지 않았고, 최종 볼륨 메시는 14,200만 개의 셀로 구성되었습니다.
메시 일관성을 보장하세요
앞서 설명했듯이 속도는 핵심 속성이지만, 시뮬레이션 결과의 신뢰성을 보장하기 위해서는 결과의 일관성 또한 매우 중요합니다. 저희는 두 소프트웨어 버전과 코어 수에 관계없이 일관성을 유지하는 것을 목표로 합니다.

광범위한 테스트에서 최종 표면 삼각형의 변동은 1% 미만이었습니다. 구체적으로, 아래 그림과 같이 Corvette 지오메트리의 경우, 2506개와 2510개 사이의 최종 표면 삼각형 개수 변동은 0.005%에 불과했습니다. 버전 2510에서는 1개, 32개, 48개 프로세서를 사용하여 세 번 실행한 결과, 직렬 실행 대비 변동이 0.06%에 불과했습니다.
표면 래퍼 결과의 이러한 일관성은 이후에 다시 메시된 표면과 결과 볼륨 메시도 일관성을 유지함을 의미합니다.

더 빠른 메싱을 위한 표면 리메셔 성능 향상
MPI Surface Wrapper는 상당한 성능 향상을 제공하고 적용되는 워크플로우를 가속화합니다. 하지만 지오메트리에 따라 표면 메시 생성에는 여전히 시간이 많이 소요될 수 있습니다. 버전 2506에서는 표면 리메셔를 개선하여 실행 시간을 최대 40%까지 단축할 수 있었습니다. 단, 이는 사례의 복잡성과 입력 CAD의 품질에 따라 달라질 수 있습니다.
예를 들어, Corvette 지오메트리(볼륨 메시에 9,300만 개의 셀 포함)는 DrivAer 지오메트리 케이스(볼륨 메시에 85,500만 개의 셀 포함)에 비해 덜 정교한 지오메트리 입력을 필요로 하며, Surface Wrapper 실행이 필요하지 않습니다. 즉, Corvette의 85,500만 개 셀에 근접하는 볼륨 메시를 구축하기 위해 이러한 표면 메시 설정을 선택한다면 프로세스가 상당히 길어질 것입니다. 이는 메싱 알고리즘의 성능을 평가할 때 맥락 정보가 얼마나 중요한지를 보여줍니다.

개선된 알고리즘과 하드웨어로 메싱 성능 최적화
Simcenter STAR-CCM+ 제품 전략의 핵심은 메싱을 포함한 모든 알고리즘의 성능을 향상시키는 것입니다. 저희 제품 개발팀은 이 목표를 달성하기 위해 최선을 다하고 있습니다. 하지만 메싱 성능은 사용된 알고리즘이나 모델의 크기만으로 결정되는 것은 아닙니다. 예를 들어, 불필요한 메시 미세 조정은 CFD 시뮬레이션의 처리 시간에 부정적인 영향을 미칠 수 있습니다.
그럼에도 불구하고 시뮬레이션 처리량에 큰 영향을 미칠 수 있는 또 다른 요소, 즉 사용되는 하드웨어에 대해 말씀드리겠습니다.
Simcenter STAR-CCM+의 표면 리메셔는 현재 직렬 모드로 작동하므로, 단일 코어를 사용하여 표면 메시를 생성하는 데 필요한 시간을 평가하여 두 가지 AMD 프로세서를 비교해 보겠습니다. 사용된 프로세서는 AMD EPYC 7532 Rome과 AMD EPYC 9755 Turin입니다. (다행히도 몇몇 동료들이 이 테스트에 맞춰 새 컴퓨터를 제공해 주었습니다!) DrivAer와 Maserati Ghibli 지오메트리 모두에 대한 표면 메시를 생성하겠습니다.
어떤 프로세서에 돈을 걸고 싶으신가요?
AMD EPYC 9755 Turin은 이전 모델(4년 2개월 더 젊음)보다 성능이 뛰어나며, 아래 그림에서 볼 수 있듯이 최대 1.9배 더 빠른 표면 메시 생성을 제공합니다. 그러나 앞서 논의했듯이 메시 생성 성능을 평가할 때는 맥락이 중요합니다. 훨씬 간단한 입력 지오메트리의 표면 메시가 Ghibli 케이스(표면 리메셔 전에 표면 래퍼를 실행해야 함)보다 훨씬 짧은 시간(최종 볼륨 메시 수와 관계없이)이 소요되는 이유는 다음과 같습니다. 두 케이스 모두 동일한 버전의 소프트웨어(Simcenter STAR-CCM+ 2510)를 사용하여 두 대의 다른 머신에서 표면 메시를 생성했습니다.
병렬 처리가 없어도 최신 프로세서는 눈에 띄게 빠른 메시 생성 속도를 제공합니다. 이는 주로 표면 메싱이 메모리 대역폭에 따라 달라지기 때문입니다. 즉, 성능이 클럭 속도보다는 메모리에서 데이터를 얼마나 빨리 전송할 수 있는지에 더 크게 좌우됩니다. AMD EPYC 9755 Turin은 더 크고 효율적인 L1/L2/L3 캐시 구조를 갖추고 있어 AMD EPYC 7532 Rome에서 사용하는 DDR4보다 더 높은 대역폭과 더 낮은 지연 시간을 제공하는 DDR5 메모리를 지원합니다. 다른 메셔들도 최신 하드웨어의 이점을 누릴 수 있지만, 성능 향상의 정도는 사용하는 메셔와 케이스의 복잡성에 따라 달라집니다.

빠른 CFD 표면 래핑 및 더 빠른 표면 메싱으로 혁신을 주도하세요
메싱 성능은 CFD 시뮬레이션에 매우 중요하며, 모든 산업 분야에서 혁신을 가능하게 합니다. Simcenter STAR-CCM+ 2510의 CFD 표면 래핑(surface wrapping) 기능은 시뮬레이션 엔지니어에게 큰 도약을 의미합니다. MPI 병렬화의 강력한 기능을 더욱 활용하여 최신 표면 래퍼(Surface Wrapper)는 가장 복잡하고 "더티(dirty)"한 지오메트리에서도 빠르고 안정적이며 확장 가능한 메싱을 제공합니다. 이러한 향상된 기능 덕분에 엔지니어는 CAD 정리 및 메시 생성 대기 시간을 단축하여 설계 공간 탐색에 더욱 집중하고, 더욱 빠르고 자신 있게 설계 결정을 내릴 수 있습니다.
그리고 우리가 여러분이 더 빨리 더 나은 예측을 할 수 있도록 앞장서고 있는 동안, 저는 Ajay Agrawal이 다음과 같이 말하는 것을 읽었습니다.
더 나은 예측은 판단력을 높여줍니다. 결국, 비 오는 날을 얼마나 좋아하는지, 우산을 얼마나 싫어하는지 모른다면 비가 올 확률을 아는 것은 아무런 도움이 되지 않습니다.
이는 모든 엔지니어에게 전하는 메시지입니다. AI/ML과 물리 기반 시뮬레이션 모두에서 예측을 더 빠르고 쉽게 생성할 수 있다는 사실은 예측을 기반으로 올바른 판단을 내리는 데 더 많은 시간을 투자하는 것이 우리의 핵심 책임이라는 것을 의미합니다.
Simcenter STAR-CCM+ 2510의 더욱 흥미로운 새로운 기능을 살펴보세요!




댓글 없음
댓글 쓰기