사회

데이터센터 D2C(Direct-to-Chip) 냉각방식 구축 총 정리

D2C냉각(Direct-to-Chip)은 CPU·GPU 위에 콜드플레이트를 직접 밀착해 열을 액체로 빼내는 방식이다. 공냉 한계를 넘는 고밀도(예: 50~90kW/rack)를 다루고, 팬 전력·소음을 낮추며, PUE·WUE 개선에도 유리하다. 이 글은 구성, 성능, 설계 포인트, 브레이징/가스켓 판형 열교환기 선택법까지 단계적으로 정리했다.

1. D2C의 정의와 필요성

D2C(Direct-to-Chip)는 서버의 CPU/GPU 위에 콜드플레이트를 장착해 칩 열을 냉각수로 직접 흡수한 뒤, CDU(Coolant Distribution Unit)설비수(Primary/FWS)로 전달해 외부에서 방열하는 액체냉각 아키텍처다. 공냉 대비 열수송 능력이 크고, 랙 밀도가 급상승하는 AI/HPC 시대에 적합하다. 또한 잔여열은 후문 열교환기(RDHx)로 처리해 실 공간 중립(Room-neutral) 운전을 돕는다. 관련 업계 표준과 실무 가이드는 ASHRAE TC 9.9OCP(Cold Plate Sub-Project)에서 확인할 수 있다.

2. 구성요소와 작동 원리

2-1) 3중 루프 개요

  • 설비수 루프(FWS) — 냉동기/쿨링타워/자유냉방과 연결되는 1차 측. 수질·부식관리 기준이 관건.
  • CDU(냉매분배유닛)열교환기·펌프·필터·팽창탱크·센서·제어로 구성된 2차 측의 심장. 공조이슬점보다 높은 공급수온 유지로 결로 방지, 온도/압력/차압을 정밀 제어한다. CDU 작동 원리
  • TCS(Technology Cooling System)/랙 매니폴드 — 랙 단위 분배·회수. 퀵디스커넥트(QD)로 안전·신속 탈착.
  • 콜드플레이트 — 칩과 접촉해 열을 냉각수로 전달. OCP 요구사항
  • 보조: RDHx — 칩 외 부품(메모리/VRM 등)에서 남은 공기열을 수냉 코일로 흡수.

일본 부동산 투자 방법 : 절차·세금·전략 완벽한 안내

2-2) 유량·연결

가속기 섀시의 예로, 콜드플레이트 1개당 약 1~2 LPM 유량이 흔하며 섀시 합계는 약 4~16 LPM 수준을 본다. 대형 랙은 여러 섀시가 병렬로 물려 전체 랙 유량이 커진다. 현장에서는 드립리스(무유출) QD를 채택해 핫스왑과 유지보수 안정성을 확보한다. 참고: OCP OAI 수냉 가이드, OCP 대형 QD 규격

3. 성능/효율: 전력밀도·PUE·WUE

3-1) 냉각방식별 랙 전력밀도(참고 범위)

냉각 방식 현실적 랙 전력밀도 범위 비고
공랭(룸/행 기반) ~7–12 kW 글로벌 평균은 약 7–8 kW 수준 보고
RDHx(후문 열교환) ~20–50 kW 모델에 따라 50 kW급 지원
D2C(콜드플레이트) ~50–90 kW+ 64-GPU 랙 사례 80–90 kW

※ 평균·카탈로그 기준을 종합한 참고 범위. 구체 값은 장비/설계/운영조건에 따라 달라진다.

3-2) 에너지·수자원 관점

  • 서버 팬 에너지 절감 — 칩 열을 직접 수냉으로 흡수해 팬 속도를 낮추면서 PUE 개선에 기여.
  • 고온수 운전W-클래스에 맞춰 높은 공급수온 운전이 가능해 자유냉방(Free-cooling)폐열회수 기회가 커진다.
  • WUE — 수배관은 닫힌회로가 기본이라 증발 손실이 없고, 타워/냉동 운영전략에 따라 WUE 개선이 가능하다.

4. 설계 핵심: 수온 클래스·유량·여과·누수대응

4-1) 수온 클래스(ASHRAE W-classes)

ASHRAE TC 9.9는 냉각수 공급온도 범위로 W17·W27·W32·W40·W45·W+ 등 클래스를 정의한다(하한 2°C, 상한을 숫자로 표기). 예를 들어 W32는 2–32°C다. 수온을 올릴수록 컴프레서 의존이 줄고 자유냉방 활용성이 커진다. 사양 대응 가능 범위는 ASHRAE 자료OCP 문서를 확인한다.

4-2) 유량·ΔT 간단 예시

예: 80 kW 랙ΔT=10°C로 설계하면 필요한 물질량유량은 ṁ = Q / (cp·ΔT) ≈ 80,000 W / (4,186 J/kg·K × 10 K) ≈ 1.91 kg/s ≈ 115 L/min이다.

ΔT=20°C면 약 57 L/min으로 줄어든다. 실제 값은 콜드플레이트 권장 유속(침식 방지), 매니폴드 차압, 펌프 여유율을 함께 맞춘다.

— 가속기 섀시 기준 1~2 LPM/콜드플레이트(섀시 합 4~16 LPM)를 가이드로 보되, 전체 랙 유량은 섀시/노드 수에 따라 크게 달라진다. OCP OAI 문서

4-3) 수질·여과

  • 여과미세 마이크로채널 보호를 위해 25~50 μm급 필터, 필요 시 사이드스트림 추가를 고려.
  • 부식/생물막 억제 — 재질 적합성 확인(구리·스테인리스·엘라스토머), 부식억제제·바이오사이드 유지.
  • 전도도 — DI 수준은 벤더 권고범위 준수(너무 낮아도 침식/용출 이슈, 너무 높아도 부식 리스크).

4-4) 누수 방지·대응

  • 드립리스 QDUQD/UQDB/BMQC 계열 등 OCP 호환 부품으로 핫스왑 안정성 확보.
  • 센싱·차단 — CDU/랙 바닥·트레이 누수감지, 단계적 펌프정지/밸브폐쇄 로직.
  • 이슬점 관리공조 이슬점 이상으로 공급수온 제어해 결로 방지.

5. 브레이징 vs 가스켓 판형 열교환기 선택

CDU의 핵심 부품인 판형 열교환기(PHE)브레이징(BPHE)가스켓(GPHE) 중 선택한다. 두 방식은 열성능·압력손실·유지보수성·청결도에서 트레이드오프가 있다.

구분 브레이징 판형(BPHE) 가스켓 판형(GPHE)
열성능/크기 매우 콤팩트, 높은 열전달계수, 소유량에서 유리 용량/유로 확장 용이, 대유량·낮은 ΔP 설계 유리
유지보수 분해청소 불가(교체 위주) 분해세정·개조 가능, 가스켓 교체로 수명 연장
수질/오염 내성 청정 폐회로에서 적합 상대적으로 오염 허용도 높음(세정 가능)
압력/재질 구리/니켈 브레이즈, 고압 대응 모델 다수 가스켓(EPDM/NBR 등) 재질 선택 폭 넓음
성능검증 AHRI 인증 라인업 존재
권장 활용 소형 CDU·고밀도 패키지, 협소공간 중대형 CDU, 세정/확장 고려, 변동부하

※ 브랜드·모델별 차이가 있어 제조사 성능표와 AHRI 인증자료로 최종 검증 권장.

5-1) 어떤 것을 고를까?

  • CDU가 작고 공간이 협소브레이징으로 컴팩트·가격경쟁력.
  • 여과 난이도가 높거나 오염 우려가스켓으로 분해세정·용량확장 유리.
  • AHRI 성능검증·재질 적합성을 반드시 확인(구리/니켈·티타늄·가스켓 화합물 등).

6. 도입 단계·체크리스트·용어해설

6-1) 단계별 도입

  1. 파일럿 — 1~2 랙에서 열밸런스·ΔT·유량·여과성능 검증, 누수 시나리오 리허설.
  2. 랙 클러스터화 — CDU 1대로 n-랙 묶고, QD 표준화(UQD/UQDB) 및 예비품 체계 구축.
  3. 플랜트 통합W-클래스에 맞춰 냉동/자유냉방 최적화, 폐열회수 연계 검토.

6-2) 빠른 체크리스트

  • 장비 호환 — 서버/가속기 수냉 SKU, 콜드플레이트 사양, 매니폴드 인터페이스.
  • 수온전략 — 목표 W-클래스(예: W32/W40), 이슬점 여유, 자유냉방 시간대.
  • 유량·차압 — 섀시/랙 요구유량, 콜드플레이트 허용유속, 펌프 NPSH·예비율.
  • 여과·수질 — 25~50 μm 필터, 부식억제, 전도도 범위, 배관 재질 적합.
  • 안전 — 드립리스 QD, 누수감지·인터록, 이중 격납 트레이.
  • 열교환기 — 브레이징/가스켓 중 용량·유지보수·공간 제약 고려.

6-3) 용어해설

  • D2C — 칩에 직접 냉각수(또는 2상 유체)를 흘려 열을 회수하는 방식.
  • CDU — 2차 루프의 온도·압력·유량을 제어·모니터링하는 유닛(열교환기 포함).
  • W-클래스 — ASHRAE의 설비수 공급온도 범주(예: W32=2–32°C).
  • RDHx — 랙 후면 수냉 코일로 잔여 공기열을 제거해 실공간 중립 운영.
  • UQD/UQDB/BMQC — OCP 계열 드립리스 퀵디스커넥트 표준 유형.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

error: Content is protected !!