일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
- speculative execution
- atomic exchange
- cache optimization
- ISA
- transactional memory
- mesi
- store conditional
- 관계형 모델
- pipelined
- sql
- multibanekd cache
- cache coherence miss
- dynamic scheduling
- structural hazard
- sequential consistency
- branch prediction
- cache coherence
- dependence
- Cache
- register renaming
- relational model
- pipline hazards
- Subquery
- pipelined cache
- nonblocking cache
- directory based coherence protocol
- load linked
- theta join
- way prediction
- moesi
- Today
- Total
목록2024/06/10 (2)
공대생의 공부흔적
이번 글에서는 domain specific 아키텍처에 대해 알아보자. 목차DSA 소개예시 - TPU1. DSA 소개무어의 법칙(칩 내 트랜지스터 점점 더 많아짐)은 CPU, GPU에서 다음과 같은 일반적인 개선사항들을 가능하게 했다.깊은 메모리 위계, 넓은 SIMD unit, 깊은 파이프라인, 브랜치 예측, OoO 실행, speculative prefetching, Multithreading, Multiprocessing이는 아키텍처를 인식하지 않는 소프트웨어에서 성능을 뽑아내는 데 목표가 있었다.이와 달리 DSA는 domain에 specific하게 설계된 아키텍처이다. 최근에는 거의 머신러닝을 타겟으로 하지만, 주요 연산 커널을 정의할 수 있다면 어떤 응용이든 가능하다. DSA를 위한 몇 가지 가이드라..
참고: Computer Architecture: A Quantitative Approach (5th edition) - 4.4.지난 글에 이어, GPU 구조에 대해 더 살펴보고 최근의 GPU 아키텍처는 어떤지 더 알아보자.목차GPU 아키텍처 G80Memory CoalescingNVIDIA Volta1. GPU 아키텍처CUDA 쓰레드 블록스레드 블록은 GPU의 위계적 구조 조직에 대한 abstraction이다. 한 블록 내 모든 스레드는 같은 커널 프로그램을 실행하며(SPMD), 프로그래머는 블록을 선언할 수 있다. 블록 크기는 1~512개의 concurrent 스레드로 이루어지며, 블록 모양은 1차원에서 3차원까지 가능하다. 스레드는 블록 내에서 스레드 id를 가지게 되고, 스레드 프로그램은 작업을 선택..