Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- 골프라운딩준비물
- 골프비용
- 높낮이계산
- 담낭청소법
- llm
- 그린플레이매너
- 골프존에서 퍼팅 공 놓는 법
- NPU
- 골프라운딩
- 담석제거
- 감마지티피
- ai agent
- Git
- Submodule
- model context protocol
- 머리올리기
- 티샷매너
- parallel computing
- Parallel Programming
- 골프존
- 간청소
- pytorch
- eager
- agent
- 계산공식
- CUDA
- 페워웨이샷매너
- react
- GPU
- 간수치
Archives
- Today
- Total
목록parallel computing (1)
Jihun Oh
CUDA 스레드 계층구조 스레드, 워프, 블록, 그리드 이렇게 네 개의 계층으로 구성. 스레드 가장 작은 단위. CUDA에서 연산을 수행하거나 CUDA 코어를 사용하는 기본 단위. 작성한 커널 코드는 모든 스레드에 공유되며, 각 스레드가 독립적으로 커널 코드를 수행. 워프 32개의 스레드를 하나로 묶은 것을 의미하며 CUDA의 기본 수행 단위. 기본 수행 단위는 한 워프에 속한 스레드들은 하나의 제어 장치에 의해서 제어된다는 것. SIMT에서 멀티 스레드의 단위. 하나의 명령에 따라 32개 스레드가 동시에 작동. 블록 워프들의 집합 streaming multiprocessor (SM)이 처리하는 단..
Engineering/Parallel programming
2025. 6. 1. 21:17