Qwen2.5 14B Instruct - Q4_K - Medium Results

Home Latest Results Download About Blog

Qwen2.5 14B Instruct

Q4_K - Medium

14.8Bparams

COMPARE ACCELERATORS

87 accelerators tested

Select Accelerators

NVIDIA GeForce RTX 5090

31GB

NVIDIA H100 PCIe

79GB

NVIDIA GeForce RTX 4090

24GB

NVIDIA GeForce RTX 4080

16GB

NVIDIA GeForce RTX 3090 Ti

24GB

Qwen2.5 14B Instruct - Q4_K - Medium

LEADERBOARD

ACCELERATOR

PROMPT

GENERATION

TTFT

LOCALSCORE

NVIDIA GeForce RTX 5090

GPU / 31GB

PROMPT

4193

tokens/s

GENERATION

54.9

tokens/s

TTFT

508

ms

LOCALSCORE

814

NVIDIA H100 PCIe

GPU / 79GB

PROMPT

2973

tokens/s

GENERATION

72.2

tokens/s

TTFT

417

ms

LOCALSCORE

802

NVIDIA GeForce RTX 4090

GPU / 24GB

PROMPT

3391

tokens/s

GENERATION

45.0

tokens/s

TTFT

402

ms

LOCALSCORE

724

NVIDIA GeForce RTX 4080

GPU / 16GB

PROMPT

2665

tokens/s

GENERATION

52.1

tokens/s

TTFT

488

ms

LOCALSCORE

658

NVIDIA GeForce RTX 3090 Ti

GPU / 24GB

PROMPT

2143

tokens/s

GENERATION

63.5

tokens/s

TTFT

586

ms

LOCALSCORE

615

NVIDIA A100-SXM4-80GB

GPU / 79GB

PROMPT

2069

tokens/s

GENERATION

66.3

tokens/s

TTFT

592

ms

LOCALSCORE

614

NVIDIA GeForce RTX 4070 Ti SUPER

GPU / 16GB

PROMPT

2454

tokens/s

GENERATION

50.4

tokens/s

TTFT

535

ms

LOCALSCORE

614

NVIDIA GeForce RTX 3080 Ti

GPU / 12GB

PROMPT

2090

tokens/s

GENERATION

59.9

tokens/s

TTFT

617

ms

LOCALSCORE

588

NVIDIA GeForce RTX 3090

GPU / 24GB

PROMPT

2034

tokens/s

GENERATION

61.4

tokens/s

TTFT

637

ms

LOCALSCORE

581

NVIDIA RTX 6000 Ada Generation

GPU / 48GB

PROMPT

2936

tokens/s

GENERATION

28.1

tokens/s

TTFT

471

ms

LOCALSCORE

560

NVIDIA GeForce RTX 4070 Ti

GPU / 12GB

PROMPT

2218

tokens/s

GENERATION

39.1

tokens/s

TTFT

611

ms

LOCALSCORE

522

NVIDIA RTX A6000

GPU / 48GB

PROMPT

1883

tokens/s

GENERATION

52.0

tokens/s

TTFT

692

ms

LOCALSCORE

521

GPU / 44GB

PROMPT

2713

tokens/s

GENERATION

24.7

tokens/s

TTFT

513

ms

LOCALSCORE

508

NVIDIA GeForce RTX 4080 SUPER

GPU / 16GB

PROMPT

2424

tokens/s

GENERATION

29.9

tokens/s

TTFT

555

ms

LOCALSCORE

507

NVIDIA H100 80GB HBM3

GPU / 79GB

PROMPT

2609

tokens/s

GENERATION

23.4

tokens/s

TTFT

475

ms

LOCALSCORE

505

NVIDIA GeForce RTX 5070 Ti

GPU / 15GB

PROMPT

2317

tokens/s

GENERATION

47.7

tokens/s

TTFT

859

ms

LOCALSCORE

505

GPU / 44GB

PROMPT

1834

tokens/s

GENERATION

46.2

tokens/s

TTFT

713

ms

LOCALSCORE

492

GPU / 45GB

PROMPT

2868

tokens/s

GENERATION

19.3

tokens/s

TTFT

495

ms

LOCALSCORE

477

NVIDIA GeForce RTX 3080

GPU / 10GB

PROMPT

1595

tokens/s

GENERATION

52.0

tokens/s

TTFT

802

ms

LOCALSCORE

470

NVIDIA RTX A5000

GPU / 24GB

PROMPT

1524

tokens/s

GENERATION

50.9

tokens/s

TTFT

846

ms

LOCALSCORE

451

NVIDIA H100 NVL

GPU / 93GB

PROMPT

2351

tokens/s

GENERATION

20.5

tokens/s

TTFT

529

ms

LOCALSCORE

450

NVIDIA GeForce RTX 4070 SUPER

GPU / 12GB

PROMPT

1903

tokens/s

GENERATION

31.9

tokens/s

TTFT

691

ms

LOCALSCORE

443

NVIDIA GeForce RTX 4070

GPU / 12GB

PROMPT

1697

tokens/s

GENERATION

38.8

tokens/s

TTFT

775

ms

LOCALSCORE

440

NVIDIA RTX A4500

GPU / 20GB

PROMPT

1330

tokens/s

GENERATION

43.8

tokens/s

TTFT

979

ms

LOCALSCORE

390

Quadro RTX 8000

GPU / 47GB

PROMPT

1178

tokens/s

GENERATION

42.9

tokens/s

TTFT

1.06

sec

LOCALSCORE

363

NVIDIA RTX 4000 Ada Generation

GPU / 20GB

PROMPT

1408

tokens/s

GENERATION

31.4

tokens/s

TTFT

952

ms

LOCALSCORE

359

NVIDIA GeForce RTX 2080 Ti

GPU / 11GB

PROMPT

1166

tokens/s

GENERATION

42.2

tokens/s

TTFT

1.08

sec

LOCALSCORE

357

GPU / 12GB

PROMPT

962

tokens/s

GENERATION

42.2

tokens/s

TTFT

1.21

sec

LOCALSCORE

323

NVIDIA RTX A4000

GPU / 16GB

PROMPT

1093

tokens/s

GENERATION

34.5

tokens/s

TTFT

1.19

sec

LOCALSCORE

316

NVIDIA A100 80GB PCIe

GPU / 79GB

PROMPT

1438

tokens/s

GENERATION

20.8

tokens/s

TTFT

954

ms

LOCALSCORE

315

NVIDIA GeForce RTX 4060 Ti

GPU / 16GB

PROMPT

1248

tokens/s

GENERATION

26.7

tokens/s

TTFT

1.10

sec

LOCALSCORE

312

NVIDIA GeForce RTX 5070

GPU / 12GB

PROMPT

1264

tokens/s

GENERATION

20.8

tokens/s

TTFT

1.07

sec

LOCALSCORE

290

GPU / 22GB

PROMPT

1095

tokens/s

GENERATION

23.6

tokens/s

TTFT

1.24

sec

LOCALSCORE

275

GPU / 22GB

PROMPT

1133

tokens/s

GENERATION

19.9

tokens/s

TTFT

1.16

sec

LOCALSCORE

269

NVIDIA RTX 4000 SFF Ada Generation

GPU / 20GB

PROMPT

1037

tokens/s

GENERATION

24.9

tokens/s

TTFT

1.34

sec

LOCALSCORE

268

NVIDIA GeForce RTX 3060

GPU / 12GB

PROMPT

782

tokens/s

GENERATION

28.3

tokens/s

TTFT

1.78

sec

LOCALSCORE

233

Apple M3 Ultra 24P+8E+80GPU

GPU / 512GB

PROMPT

579

tokens/s

GENERATION

35.9

tokens/s

TTFT

2.03

sec

LOCALSCORE

217

NVIDIA RTX 2000 Ada Generation

GPU / 16GB

PROMPT

733

tokens/s

GENERATION

21.0

tokens/s

TTFT

1.83

sec

LOCALSCORE

203

AMD Radeon RX 6900 XT

GPU / 16GB

PROMPT

612

tokens/s

GENERATION

24.5

tokens/s

TTFT

2.40

sec

LOCALSCORE

184

AMD Radeon RX 7900 XTX

GPU / 24GB

PROMPT

485

tokens/s

GENERATION

31.6

tokens/s

TTFT

2.67

sec

LOCALSCORE

179

Apple M3 Ultra 20P+8E+60GPU

GPU / 96GB

PROMPT

445

tokens/s

GENERATION

34.4

tokens/s

TTFT

2.67

sec

LOCALSCORE

179

AMD Radeon RX 6800 XT

GPU / 16GB

PROMPT

505

tokens/s

GENERATION

20.5

tokens/s

TTFT

2.88

sec

LOCALSCORE

153

AMD Radeon RX 6800

GPU / 16GB

PROMPT

404

tokens/s

GENERATION

19.5

tokens/s

TTFT

3.53

sec

LOCALSCORE

131

Apple M4 Max 12P+4E+40GPU

GPU / 128GB

PROMPT

309

tokens/s

GENERATION

27.9

tokens/s

TTFT

3.99

sec

LOCALSCORE

130

Apple M1 Ultra 16P+4E+48GPU

GPU / 128GB

PROMPT

290

tokens/s

GENERATION

27.8

tokens/s

TTFT

4.04

sec

LOCALSCORE

126

AMD Radeon RX 7800 XT

GPU / 16GB

PROMPT

316

tokens/s

GENERATION

23.0

tokens/s

TTFT

4.22

sec

LOCALSCORE

120

Apple M4 Max 10P+4E+32GPU

GPU / 36GB

PROMPT

277

tokens/s

GENERATION

26.4

tokens/s

TTFT

4.46

sec

LOCALSCORE

118

Apple M2 Max 8P+4E+38GPU

GPU / 96GB

PROMPT

252

tokens/s

GENERATION

25.2

tokens/s

TTFT

4.80

sec

LOCALSCORE

110

Tesla P100-SXM2-16GB

GPU / 16GB

PROMPT

204

tokens/s

GENERATION

20.5

tokens/s

TTFT

5.71

sec

LOCALSCORE

90

NVIDIA GeForce RTX 3060 Ti

GPU / 8GB

PROMPT

430

tokens/s

GENERATION

7.5

tokens/s

TTFT

5.55

sec

LOCALSCORE

83

Apple M4 Pro 10P+4E+20GPU

GPU / 24GB

PROMPT

189

tokens/s

GENERATION

18.0

tokens/s

TTFT

6.66

sec

LOCALSCORE

80

Apple M4 Pro 10P+4E+20GPU

GPU / 64GB

PROMPT

179

tokens/s

GENERATION

17.8

tokens/s

TTFT

7.03

sec

LOCALSCORE

77

NVIDIA GeForce RTX 3070

GPU / 8GB

PROMPT

376

tokens/s

GENERATION

5.1

tokens/s

TTFT

8.07

sec

LOCALSCORE

62

Apple M3 Pro 6P+6E+18GPU

GPU / 36GB

PROMPT

150

tokens/s

GENERATION

12.1

tokens/s

TTFT

8.56

sec

LOCALSCORE

60

Apple M3 Pro 6P+6E+18GPU

GPU / 18GB

PROMPT

144

tokens/s

GENERATION

11.6

tokens/s

TTFT

8.97

sec

LOCALSCORE

57

NVIDIA GeForce RTX 4060 Ti

GPU / 8GB

PROMPT

327

tokens/s

GENERATION

3.5

tokens/s

TTFT

7.99

sec

LOCALSCORE

52

Apple M3 Pro 5P+6E+14GPU

GPU / 18GB

PROMPT

117

tokens/s

GENERATION

12.0

tokens/s

TTFT

10.75

sec

LOCALSCORE

51

Apple M1 Pro 6P+2E+14GPU

GPU / 16GB

PROMPT

94

tokens/s

GENERATION

10.8

tokens/s

TTFT

13.39

sec

LOCALSCORE

42

Apple M4 4P+6E+10GPU

GPU / 16GB

PROMPT

96

tokens/s

GENERATION

9.6

tokens/s

TTFT

13.39

sec

LOCALSCORE

41

Apple M2 4P+4E+10GPU

GPU / 24GB

PROMPT

70

tokens/s

GENERATION

7.3

tokens/s

TTFT

18.03

sec

LOCALSCORE

31

Apple M3 4P+4E+10GPU

GPU / 24GB

PROMPT

67

tokens/s

GENERATION

6.3

tokens/s

TTFT

17.71

sec

LOCALSCORE

29

Apple M1 4P+4E+7GPU

GPU / 16GB

PROMPT

41

tokens/s

GENERATION

4.8

tokens/s

TTFT

31.76

sec

LOCALSCORE

18