whisper.cpp

ggml-org/whisper.cpp

Fork 0

mirror of https://github.com/ggml-org/whisper.cpp.git synced 2026-03-28 19:27:07 +00:00

Commit Graph

Select branches

Hide Pull Requests

arghh

avx512

batched

bench-memcpy

chess

ci/env

copilot/add-duplicate-text-removal

coreml-with-state

cuda-cublas-opts

diarization

distil-support

experiment/model-compression

fa-decoder

feature/debug-gradle-signing

fix-bench

fix-coreml-ane

fix-vzip

fix_vs_sdl2

gg/alloc-enc-results

gg/bench-fix-print

gg/benches-update

gg/chess

gg/ci-cuda-fix

gg/ci-fix-android

gg/ci-fix-windows

gg/cuda-fix-mmvq

gg/cuda-no-async

gg/disable-cuda-graphs

gg/fix-external-encoder

gg/hipblas-fix

gg/make-fix-glob

gg/objc

gg/prompt-tokens

gg/reduce-ctx-use

gg/wchess

gg/whisper-short-audio-check

ggml-backend

ggml-backend-no-sched

ggml-conv

grammar-debug

guided

java-bindings

large-v3

llama-podcast

macros-cvt-fp16

master

metal

metal-and-alloc

nvblas

parallel-states

quantize-encoder

stream

sync-ggml-25-04-02-2

sync-ggml-25-05-07

sync-ggml-25-05-13

sync-ggml-25-09-30-2

sync-ggml-25-12-12

sync-ggml-25-12-17

talk.llama-coreml

threads

timing

try-fix-abort

word-ts-2

#1001

#1002

#1003

#1010

#1012

#1015

#102

#1021

#1021

#1024

#1027

#1029

#1031

#1032

#1034

#1037

#1041

#1042

#1045

#1046

#1049

#1054

#1058

#1060

#1062

#1064

#1067

#107

#1074

#1074

#1077

#1081

#1086

#1086

#1092

#1097

#1097

#110

#1101

#111

#1110

#1111

#1112

#1113

#1114

#1115

#1118

#1118

#1120

#1124

#1128

#1129

#1130

#1131

#1134

#1136

#1137

#114

#1142

#1143

#1144

#1147

#1148

#115

#1154

#116

#1160

#1162

#1164

#1164

#1173

#1174

#1196

#1204

#1205

#1209

#121

#1210

#1211

#1212

#1214

#1216

#1217

#1218

#1220

#1224

#1227

#1228

#1229

#123

#1231

#1235

#1238

#124

#1243

#1247

#1250

#1251

#1253

#1254

#1255

#1261

#1261

#1263

#1264

#1265

#1267

#127

#127

#1270

#1275

#128

#1286

#1290

#1293

#1294

#1298

#130

#130

#1303

#1304

#1305

#1306

#131

#1310

#1313

#1317

#1330

#1334

#1335

#1345

#1349

#135

#1350

#1352

#1356

#1358

#136

#1362

#1364

#1368

#1370

#1375

#1375

#1380

#1381

#1381

#1382

#1389

#1400

#1404

#141

#1415

#1417

#1418

#1418

#1420

#1422

#1424

#143

#1432

#1434

#1440

#1441

#1442

#1444

#1445

#1452

#1455

#1455

#1456

#1457

#1458

#1459

#1462

#1466

#1467

#147

#1472

#1473

#1474

#1475

#1478

#1478

#1479

#1484

#1485

#1486

#1487

#1492

#1493

#1499

#1499

#150

#1500

#1500

#1501

#1505

#1519

#1521

#1522

#1523

#1524

#1524

#1529

#1530

#1533

#1534

#1535

#1539

#1541

#1544

#1545

#1546

#1547

#1548

#1549

#1549

#155

#1551

#1554

#1559

#1559

#1560

#1561

#1563

#1563

#1565

#1567

#1568

#1574

#1575

#1576

#1578

#1582

#1583

#1586

#1588

#1589

#1595

#160

#1602

#1604

#1604

#1605

#1606

#1607

#1615

#1617

#1627

#1627

#163

#1633

#1649

#1649

#1650

#1651

#1655

#1658

#1667

#1669

#1672

#1673

#1674

#1675

#1677

#1679

#1679

#1681

#1691

#1692

#1694

#1695

#170

#1701

#1703

#1704

#1713

#1714

#1716

#1717

#1725

#1727

#1728

#1729

#1735

#174

#1740

#1741

#1744

#1747

#1749

#175

#1750

#1753

#1754

#1755

#1758

#1763

#1764

#1765

#1768

#1768

#1772

#1774

#1778

#1781

#1785

#179

#1791

#1791

#1792

#1802

#1806

#1809

#1812

#1813

#1819

#1823

#1823

#183

#1833

#1833

#1838

#1839

#1840

#1841

#1841

#1842

#1850

#1854

#1854

#1857

#1859

#1860

#1861

#1863

#1865

#1871

#1872

#1874

#1878

#1888

#1889

#1890

#1891

#1895

#1897

#19

#1902

#1913

#1913

#1917

#1924

#1924

#1925

#1926

#1928

#1929

#193

#1932

#1933

#1938

#194

#1942

#1943

#1944

#1945

#1947

#195

#1952

#1952

#1953

#1964

#1965

#1966

#1969

#1969

#1970

#1973

#1973

#1978

#1980

#1981

#1982

#1983

#1990

#1990

#1994

#1997

#1998

#20

#2000

#2001

#2004

#2005

#2005

#201

#2012

#2019

#2020

#2024

#2025

#2026

#203

#203

#2043

#2044

#2045

#2048

#2049

#2054

#2058

#2063

#2068

#2068

#2069

#2070

#2071

#2071

#2072

#2073

#2075

#2075

#2080

#2086

#2088

#2090

#2094

#2095

#2095

#21

#2100

#2102

#2108

#2115

#2119

#2121

#2123

#2127

#2127

#2128

#2129

#2133

#2138

#2142

#2152

#2153

#2154

#2166

#2170

#2181

#2182

#2184

#2184

#2189

#2194

#2196

#2198

#2206

#2208

#2217

#222

#2220

#2227

#2231

#2232

#2234

#2235

#2236

#2237

#2238

#2239

#224

#2240

#2242

#2254

#2254

#2256

#2261

#2264

#2266

#2267

#2270

#2272

#2272

#2279

#2279

#228

#2288

#229

#2290

#2291

#2294

#2299

#23

#230

#2302

#231

#2311

#2324

#2330

#2336

#2339

#2342

#2343

#2346

#2350

#2358

#2360

#2367

#2369

#2369

#2376

#2382

#2383

#2384

#2386

#2387

#239

#2391

#2393

#2396

#24

#2401

#2406

#2406

#2407

#2410

#2414

#2416

#2417

#2419

#2424

#2425

#2427

#2429

#2431

#2432

#2432

#2433

#2440

#2443

#2444

#2449

#245

#2451

#2455

#2464

#2475

#2477

#2481

#2484

#2485

#2488

#2489

#2495

#2505

#2506

#2511

#2515

#2516

#2517

#2518

#2519

#252

#2523

#2525

#2528

#2529

#253

#2534

#254

#2543

#2546

#2547

#2548

#2549

#2550

#2551

#2555

#2560

#2560

#2561

#2562

#2567

#2569

#257

#2570

#2573

#2574

#2576

#2577

#2577

#2579

#2580

#2585

#2589

#2593

#2593

#260

#2604

#2608

#2611

#2613

#2617

#2623

#2624

#2625

#2629

#2633

#2634

#2634

#2635

#2637

#2638

#2639

#2641

#2642

#2643

#2648

#2649

#2653

#2654

#2656

#2659

#2663

#2664

#2670

#2674

#2676

#2683

#2684

#2686

#2687

#2690

#2690

#2691

#2691

#2692

#2693

#2694

#2694

#2699

#27

#2700

#2707

#2709

#271

#2711

#2716

#2718

#2728

#273

#2734

#2736

#2737

#274

#2745

#2749

#2756

#2759

#2760

#2769

#2769

#277

#2770

#2777

#2779

#2790

#2796

#2797

#2799

#28

#2800

#2800

#2816

#282

#2821

#2822

#2824

#2826

#2826

#2831

#2831

#2832

#2832

#2836

#2838

#2838

#284

#284

#2840

#2842

#2842

#2843

#2844

#2845

#2846

#285

#2851

#2853

#2855

#2858

#286

#2862

#2863

#2868

#287

#2873

#2875

#2876

#2877

#2878

#2879

#288

#2880

#2882

#2887

#2889

#2891

#2893

#2895

#2896

#29

#2900

#2902

#2904

#2905

#2908

#291

#2910

#2911

#2912

#2914

#2915

#2916

#2918

#2919

#2921

#2923

#2924

#2925

#2932

#2935

#2937

#2938

#2939

#294

#2941

#2942

#2943

#2945

#2946

#2947

#2948

#2949

#2951

#2952

#2953

#2955

#2956

#2958

#2959

#296

#2960

#2962

#2966

#2968

#2969

#2971

#2972

#2973

#2975

#2976

#2977

#2979

#298

#2981

#2985

#2986

#2987

#2988

#299

#2990

#2991

#2992

#2993

#2994

#2997

#2999

#3

#3000

#3001

#3002

#3004

#3005

#3006

#3007

#301

#3016

#302

#3021

#3022

#3024

#3025

#3027

#3028

#3029

#3031

#3033

#3038

#3042

#3043

#3044

#3045

#3050

#3052

#3054

#3054

#3055

#3056

#3057

#306

#3060

#3062

#3064

#3065

#3068

#3069

#3070

#3071

#3073

#3075

#3076

#308

#3082

#3083

#3084

#3085

#3086

#3087

#3090

#3097

#3098

#31

#3100

#3101

#3102

#3103

#3104

#3106

#3108

#3109

#3112

#3114

#3120

#3124

#3125

#3126

#3127

#3130

#3131

#3132

#3133

#3134

#3136

#3138

#3140

#3141

#3142

#3143

#3145

#3147

#3148

#3149

#3150

#3151

#3152

#3156

#3157

#3158

#3160

#3160

#3163

#3164

#317

#3170

#3171

#3172

#3173

#3175

#3177

#3178

#3179

#318

#3180

#3181

#3183

#3184

#3185

#3186

#3187

#3189

#319

#3190

#3191

#3192

#3193

#3195

#3196

#3197

#3199

#320

#3200

#3201

#3202

#3203

#3206

#3208

#3209

#3214

#3215

#3217

#3218

#3218

#3219

#322

#3220

#3221

#3222

#3223

#3223

#3229

#323

#3230

#3231

#3233

#3234

#3237

#3239

#324

#3241

#3242

#3243

#3244

#3244

#3245

#3246

#3247

#3251

#3255

#3257

#3257

#3261

#3262

#3264

#3265

#3266

#3268

#3270

#3272

#3273

#3274

#3274

#3275

#3276

#3277

#3281

#3282

#3283

#3284

#3287

#3288

#3289

#3291

#3291

#3292

#3294

#3296

#3298

#3298

#3300

#3301

#3307

#331

#3310

#3313

#3313

#3318

#3319

#3321

#3321

#3322

#3323

#3324

#3325

#3325

#3327

#3328

#3329

#3332

#3333

#3336

#3342

#3346

#3349

#3350

#3354

#336

#3363

#3365

#3369

#3371

#3372

#3374

#3374

#3378

#3378

#3379

#3381

#3383

#3387

#3387

#3389

#3394

#3395

#34

#340

#3401

#3401

#3406

#3408

#3409

#3412

#3412

#3416

#3417

#3417

#3419

#3419

#3422

#3422

#3423

#3423

#3425

#3426

#3428

#343

#343

#3430

#3430

#3433

#3433

#3436

#3437

#3438

#3439

#3441

#3442

#3443

#3445

#3447

#3448

#345

#3453

#3456

#3457

#3457

#346

#3461

#3462

#3462

#3463

#3466

#3467

#3468

#3468

#3469

#3470

#3471

#3471

#3472

#3472

#3473

#3473

#3474

#3474

#3477

#3478

#3482

#3483

#3484

#3485

#3485

#3487

#3488

#3489

#3489

#349

#3490

#3492

#3494

#3494

#3495

#3495

#3496

#3498

#350

#3502

#3502

#3503

#3505

#3505

#3506

#3506

#3507

#351

#3513

#3514

#3516

#3518

#3519

#3522

#3524

#3526

#3527

#3527

#3528

#3529

#3529

#353

#3532

#3533

#3534

#3535

#3540

#3540

#3543

#3543

#3555

#3555

#3557

#3558

#3559

#3563

#3564

#3565

#3565

#3566

#3568

#3569

#357

#3572

#3573

#3575

#3578

#3578

#3579

#3580

#3581

#3582

#3582

#3583

#3585

#3587

#3587

#3588

#3588

#3589

#3589

#359

#3590

#3591

#3592

#3593

#3594

#3594

#3598

#3598

#3599

#3599

#36

#3600

#3605

#3605

#3606

#3608

#3608

#3610

#3610

#3612

#3612

#3615

#3615

#3616

#3616

#3617

#3617

#3619

#3619

#362

#3621

#3624

#3625

#3625

#3626

#3626

#3630

#3632

#3632

#3633

#3636

#3637

#3637

#3638

#3638

#3639

#3641

#3641

#3644

#3646

#3647

#3649

#365

#3650

#3650

#3652

#3653

#3653

#3655

#3656

#3656

#3658

#3658

#366

#3660

#3660

#3661

#3661

#3665

#3668

#3670

#3671

#3672

#3675

#3675

#3677

#3677

#3678

#3679

#368

#3684

#3685

#3686

#3686

#3689

#369

#3691

#3691

#3693

#3693

#3696

#3696

#3699

#3699

#3703

#3704

#3704

#3705

#3707

#3709

#3710

#3711

#3713

#3714

#3714

#3715

#3716

#3716

#3719

#3719

#3727

#3727

#379

#38

#381

#383

#384

#387

#388

#390

#391

#398

#404

#409

#41

#415

#42

#424

#425

#43

#431

#435

#436

#439

#443

#444

#446

#451

#453

#454

#454

#455

#456

#459

#461

#462

#468

#473

#474

#476

#482

#484

#485

#486

#494

#495

#497

#500

#501

#502

#502

#503

#506

#515

#520

#523

#532

#534

#537

#538

#540

#542

#552

#563

#566

#569

#572

#576

#58

#583

#60

#600

#605

#613

#613

#615

#619

#624

#624

#626

#627

#628

#629

#629

#638

#640

#642

#645

#648

#649

#650

#650

#659

#659

#664

#668

#67

#677

#682

#685

#686

#687

#688

#697

#70

#704

#706

#710

#711

#712

#716

#718

#72

#720

#721

#725

#728

#733

#737

#739

#740

#755

#759

#760

#763

#764

#768

#77

#776

#78

#798

#81

#810

#811

#812

#815

#816

#832

#833

#834

#835

#836

#837

#842

#845

#853

#854

#862

#863

#867

#87

#871

#871

#874

#875

#883

#885

#890

#891

#893

#899

#902

#908

#910

#915

#926

#927

#931

#935

#939

#939

#94

#944

#95

#956

#964

#968

#968

#971

#971

#972

#995

0.0.5-3

0.0.6-1

1.0.3

1.0.4

1.1.0

1.4.1-1

1.4.1-2

1.5.2

b2250

b2251

b2252

b2253

b2254

b2257

b2258

b2259

b2260

b2261

b2262

b2263

b2266

b2267

b2268

b2269

b2270

b2271

b2273

b2274

b2275

b2276

b2279

b2280

b2339

b2340

b2341

b2342

b2348

b2349

b2350

b2351

b2352

b2353

b2362

b2364

b2365

danbev-java-jar-artifact-test

danbev-testing-xcframework-release

v1.0.4

v1.1.0

v1.1.1

v1.2.0

v1.2.1

v1.3.0

v1.4.0

v1.4.1

v1.4.2

v1.4.3

v1.5.0

v1.5.1

v1.5.2

v1.5.3

v1.5.4

v1.5.5

v1.6.0

v1.6.1

v1.6.2

v1.7.0

v1.7.1

v1.7.2

v1.7.2-pre

v1.7.3

v1.7.3-pre

v1.7.4

v1.7.4-pre-0

v1.7.4-pre-1

v1.7.5

v1.7.6

v1.8.0

v1.8.1

v1.8.2

v1.8.3

v1.8.4

a8d02735f7 vulkan: Replace deprecated VK_EXT_validation_features (llama/17637) Masato Nakasaka 2025-12-06 14:39:42 +09:00
191e5f46a2 vulkan: Fix mismatch in TOPK_MOE unit test (llama/17541) Masato Nakasaka 2025-12-06 14:23:30 +09:00
64a3f573e0 vulkan: add more num_blocks instantiations in rms_norm (llama/17701) Jeff Bolz 2025-12-05 15:08:56 -06:00
0484147ab2 vulkan: fix top_k bug when there are ties in the input (llama/17659) Jeff Bolz 2025-12-05 15:03:19 -06:00
0b53759b29 vulkan : support conv-2d with large output size (llama/17685) Acly 2025-12-05 21:46:39 +01:00
23984be4da ggml webgpu: unary op suppport, code refactoring, ops support (llama/17764) Reese Levine 2025-12-05 12:25:51 -08:00
7e97d3b069 vulkan: enable mmvq for q2_k on NVIDIA (llama/17675) Jeff Bolz 2025-12-05 14:21:57 -06:00
32ba1ec8e0 vulkan: set all memory allocations to high priority (llama/17624) Jeff Bolz 2025-12-05 14:21:04 -06:00
aefcd75f4f rpc : fix alloc size logic (llama/17116) Georgi Gerganov 2025-12-05 19:39:04 +02:00
322903fa67 metal : add residency sets keep-alive heartbeat (llama/17766) Georgi Gerganov 2025-12-05 19:38:54 +02:00
4170159dcd HIP : fix RDNA4 build (llama/17792) Johannes Gäßler 2025-12-05 13:47:52 +01:00
d30b744047 Q4/Q8 Tiled Gemm Optimization. (llama/16999) shalinib-ibm 2025-12-05 17:11:51 +05:30
14502d6561 CUDA: fix FA VKQ accumulator overflow (llama/17746) Johannes Gäßler 2025-12-05 09:18:10 +01:00
e3f3c6ead1 HIP: enable WMMA-MMQ INT kernels for RDNA 3 (llama/17576) Jiacheng (Jason) Chen 2025-12-05 03:17:37 -05:00
8d44d6181a Add support for CUMSUM and TRI for CUDA. (llama/17584) Piotr Wilkin (ilintar) 2025-12-04 22:19:51 +01:00
8902c9d976 metal: TRI, FILL, EXPM1, SOFTPLUS (llama/16623) Gabe Goodhart 2025-12-04 10:12:19 -07:00
f96ebc92d2 ggml-cpu : remove asserts always evaluating to false (llama/17728) Alberto Cabrera Pérez 2025-12-04 12:16:38 +00:00
194d016456 metal : use params per pipeline instance (llama/17739) Georgi Gerganov 2025-12-04 10:34:11 +02:00
92e50155c9 build : move _WIN32_WINNT definition to headers (llama/17736) Adrien Gallouët 2025-12-04 07:04:02 +01:00
3794a0d3b6 ggml-cpu: remove duplicate conditional check 'iid' (llama/17650) Herman Semenoff 2025-12-04 00:03:19 +03:00
7adbcafb6c CUDA: generalized (mma) FA, add Volta support (llama/17505) Johannes Gäßler 2025-12-03 16:57:05 +01:00
4a00f2e3a4 metal : fix data race in pipeline library (llama/17731) Georgi Gerganov 2025-12-03 14:03:40 +02:00
d263bdbfb6 ggml webgpu: add support for emscripten builds (llama/17184) Reese Levine 2025-12-03 01:25:34 -08:00
86cb5ab93f vulkan: Reduce temporary memory usage for TOP_K (llama/17623) Jeff Bolz 2025-12-02 12:22:04 -06:00
fffdf679d4 cmake : add utf8 compilation options for msvc (llama/17682) xiaobing318 2025-12-03 01:50:57 +08:00
16688c6d2c ggml : use svcntb() for SVE vector length detection (llama/17474) Adrien Gallouët 2025-12-02 17:21:11 +01:00
a64d46a529 CANN: Disable Ger operator of OUT_PROD on 310p device (llama/17563) TianHao324 2025-12-02 20:35:23 +08:00
201b910743 ggml : remove redundant n_copies check when setting input/output (llama/17612) Daniel Bevenius 2025-12-02 12:52:45 +01:00
e2537b4af3 ggml : add fallback definition for HWCAP2_SVE2 (llama/17683) Adrien Gallouët 2025-12-02 09:41:26 +01:00
4c89232b5c ggml-cuda: reorder only relevant nodes (llama/17639) Aman Gupta 2025-12-02 12:36:31 +08:00
26732d28c4 enhance argsort for UT (llama/17573) Neo Zhang Jianyu 2025-12-02 08:56:46 +08:00
32090930f7 metal : add FA head size 48 (llama/17619) Georgi Gerganov 2025-12-01 12:49:53 +02:00
7cd3de89bf ggml : extend the GGML_SCHED_NO_REALLOC debug logic of the scheduler (llama/17617) Georgi Gerganov 2025-12-01 12:49:33 +02:00
6cc2d0534f llama-graph: avoid expand_forward for fusion (llama/17633) Aman Gupta 2025-12-01 17:12:48 +08:00
0defeee679 model: LFM2-VL fixes (llama/17577) Tarek Dakhran 2025-11-30 21:57:31 +01:00
706647202e ggml: fix: macOS build with -DGGML_BACKEND_DL=ON (llama/17581) Gilad S. 2025-11-30 04:00:59 +02:00
e68ee6e281 CUDA: add stream-based concurrency (llama/16991) Aman Gupta 2025-11-30 08:17:55 +08:00
2e4a7a21fa cuda : add error checking for cudaMemcpyAsync in argsort (llama/17599) Mahekk Shaikh 2025-11-29 19:16:28 -05:00
2258930c2e vulkan : fix FA mask load with bounds check (coopmat2) (llama/17606) Acly 2025-11-30 01:03:21 +01:00
a3459484bf sycl : support to malloc memory on device more than 4GB, update the doc and script (llama/17566) Neo Zhang 2025-11-29 20:59:44 +08:00
28dff06555 ggml: replace hwcap with riscv_hwprobe for RVV detection (llama/17567) ixgbe 2025-11-29 20:56:31 +08:00
2fcc0a3a9f Vulkan: MMVQ Integer Dot K-Quant and MUL_MAT_ID support (llama/16900) Ruben Ortlam 2025-11-29 09:37:22 +01:00
dbf8766ffa vulkan: improve topk perf for large k, fix overflow in unit tests (llama/17582) Jeff Bolz 2025-11-29 01:39:57 -06:00
463003e76c ggml : add GGML_SCHED_NO_REALLOC option to disable reallocations in ggml_backend_sched (llama/17276) Diego Devesa 2025-11-28 07:33:23 -08:00
c372bdbb3c enable fp16/fast_fp16/bf16_mma on PH1 (llama/17551) R0CKSTAR 2025-11-28 21:08:29 +08:00
90ca4e0a07 ggml-cuda: add stricter checking for fusion (llama/17568) Aman Gupta 2025-11-28 20:34:51 +08:00
43441ff58a model : Qwen3 Next (llama/16095) Piotr Wilkin (ilintar) 2025-11-28 12:02:56 +01:00
37e4c2ed3a CUDA: no FP16 arithmetic for vector FA kernel (llama/17558) Johannes Gäßler 2025-11-28 10:29:09 +01:00
7a20963140 vulkan: Implement GGML_OP_TRI (llama/17503) Jeff Bolz 2025-11-28 03:07:29 -06:00
d26d1c8b85 rpc : cache and reuse compute graphs (llama/15405) Radoslav Gerganov 2025-11-28 10:33:51 +02:00
f92d542d4d HIP: enable mul_mat_f for RDNA4 (llama/17437) yulo 2025-11-28 15:24:30 +08:00
51e842d106 SOLVE_TRI CUDA kernel for small matrices (llama/17457) Piotr Wilkin (ilintar) 2025-11-28 05:15:32 +01:00
93bc8dc5a8 refactor pad_reflect_1d to make the UT case pass (llama/17204) Neo Zhang Jianyu 2025-11-28 08:50:56 +08:00
3727a36c48 vulkan: Implement SOLVE_TRI (llama/17486) Jeff Bolz 2025-11-27 08:48:00 -06:00
e682af7886 cuda : fix UMA detection on discrete GPUs. (llama/17537) matt23654 2025-11-27 11:35:35 +00:00
93f6cdb9c0 ggml-cpu: aarm64: q4_K repack gemm and gemv implementations (dotprod only) (llama/17494) Alberto Cabrera Pérez 2025-11-27 11:25:14 +00:00
ac92424b59 vulkan : move contiguous checks to device_supports_op (llama/17490) Acly 2025-11-27 06:54:19 +01:00
310db24fca vulkan: use a fixed 1KB buffer for the add_rms_fusion opt (llama/17514) Jeff Bolz 2025-11-26 23:32:30 -06:00
74ef5dd1a9 opencl: add sqr, sqrt, mean and ssm_conv (llama/17476) lhez 2025-11-26 13:29:58 -08:00
3de4372465 Fix chunks being too small with small matrix sizes (llama/17526) Alberto Cabrera Pérez 2025-11-26 21:14:54 +00:00
c8050e5fdc vulkan: allow graph_optimize for prompt processing workloads (llama/17475) Jeff Bolz 2025-11-26 09:46:33 -06:00
d8b61e05f8 vulkan: Implement top-k (llama/17418) Jeff Bolz 2025-11-26 09:45:43 -06:00
fb31a19797 ggml-cpu : add RISC-V Zvfh impl for ggml_vec_mad_f16 (llama/17448) xctan 2025-11-26 21:33:05 +08:00
8e3560c7ce ggml : fix ARM feature verification (llama/17519) Adrien Gallouët 2025-11-26 14:14:41 +01:00
bb7223da8a HIP: Patch failed testcase in WMMA-MMQ kernels for RDNA 4 (llama/17502) Jiacheng (Jason) Chen 2025-11-26 05:18:48 -05:00
f0c54d47e1 CANN: Add MROPE and IMROPE support (llama/17401) hipudding 2025-11-26 16:44:19 +08:00
208450048c vulkan: Implement GGML_OP_CUMSUM (llama/17479) Jeff Bolz 2025-11-26 00:08:10 -06:00
968db8bcfa ggml : add ggml_top_k (llama/17365) Georgi Gerganov 2025-11-25 15:31:43 +02:00
e00bb753d6 CANN: supports out_prod operator for F32 and F16 (llama/17406) TianHao324 2025-11-25 17:39:06 +08:00
273e4fe7ae vulkan: Use fewer rows for scalar FA when HS is not a multiple of 16 (llama/17455) Jeff Bolz 2025-11-25 00:11:27 -06:00
553d57a4e7 vulkan: more FA details in vk_perf_logger (llama/17443) Jeff Bolz 2025-11-24 15:25:24 -06:00
371a21865a HIP: WMMA-MMQ kernels for RDNA 4 (llama/17156) Jiacheng (Jason) Chen 2025-11-24 14:00:10 -05:00
f4ede89d24 ggml-cpu: arm64: q4_K repack gemm and gemv implementations (i8mm) (llama/16739) Alberto Cabrera Pérez 2025-11-24 11:08:11 +00:00
faf37ffe76 ggml: add RISC-V cpu-feats (llama/17461) ixgbe 2025-11-24 19:07:14 +08:00
77d874b1c3 hexagon: add support for ROPE_NEOX (llama/17458) Max Krasnyansky 2025-11-23 18:55:56 -08:00
5ed0ddc458 CANN: Define cann_graph_update_required before macro (llama/17434) Raul Torres 2025-11-24 02:02:52 +00:00
75cea7f8be ggml-hexagon: Initial Hexagon v68/v69 support (llama/17394) M. Mediouni 2025-11-24 01:54:49 +01:00
621cb871b3 ggml-hexagon: add hex_supported_buffer for better buffer supported check (llama/17212) nullname 2025-11-24 06:26:36 +08:00
61e0b7ed48 cuda : support non-contiguous i32 to i32 copy (llama/17326) Sigbjørn Skjæret 2025-11-23 11:13:34 +01:00
deb4958add vulkan: remove a couple unnecessary switches (llama/17419) Jeff Bolz 2025-11-22 23:29:40 -06:00
fc6eae781d HIP: RDNA4 tensor core support for MMF (llama/17077) yulo 2025-11-22 07:03:24 +08:00
5c0e4a9cc5 opencl: refine condition for kqv mm (llama/17392) lhez 2025-11-21 14:34:48 -08:00
cdc1a776be vulkan: disable async for older Intel devices (llama/17369) Jeff Bolz 2025-11-21 02:58:17 -06:00
a009dc172c CANN: Refactor evaluate_and_capture_cann_graph (llama/17333) Raul Torres 2025-11-21 08:23:29 +00:00
cb3ee1b098 ggml-hexagon: fix swiglu failure at test-backend-ops (llama/17344) nullname 2025-11-21 07:45:05 +08:00
46f893c2fa ggml : Fix transposed SOLVE_TRI result (llama/17323) Piotr Wilkin (ilintar) 2025-11-20 11:58:21 +01:00
510805e6c1 DGX Spark: UMA support (llama/17368) Scott Fudally 2025-11-20 02:32:02 -08:00
2f20938b58 ggml : remove useless and error-prone variadic macros (llama/17399) Adrien Gallouët 2025-11-20 11:18:27 +01:00
51f5438089 kleidiai: fix zero-size array declaration (llama/17240) sudhiarm 2025-11-20 09:45:49 +00:00
1d3a525001 ggml-cpu:add RISC-V RVV (Zvfh) optimization for FP16 vector scaling (llama/17314) ixgbe 2025-11-20 14:09:18 +08:00
24b14cad87 vulkan: implement ADD1, ARANGE, FILL, SOFTPLUS, STEP, ROUND, CEIL, FLOOR, TRUNC (llama/17319) Giuseppe Scrivano 2025-11-19 17:29:45 +01:00
95d0b0b0cf vulkan: support larger argsort (llama/17313) Jeff Bolz 2025-11-19 10:25:50 -06:00
ae8865c6e6 vulkan: Add copy_transpose shader (llama/17371) Jeff Bolz 2025-11-19 09:50:43 -06:00
73d396826b cuda: fix rope fusion for gemma3 (llama/17378) Aman Gupta 2025-11-19 18:25:05 +08:00
746cbed20a Fix too relaxed check on CUDA "fast copy" (can_be_transposed) condition (llama/17332) Piotr Wilkin (ilintar) 2025-11-19 10:36:33 +01:00
2097a9c1bd vulkan: force full subgroups for flash attention to fix intel subgroup crash (llama/17356) Ruben Ortlam 2025-11-19 08:46:26 +01:00
27c69271c5 ggml-cpu: Don't pass -mpowerpc64 when -mcpu already implies it (llama/17308) Jeremy Rand 2025-11-19 06:19:00 +00:00
c137d11b81 CANN: fix acl_tensor_ptr usage in ASCEND_310P ROPE (llama/17347) Chenguang Li 2025-11-18 16:41:52 +08:00
24b981eff7 vulkan: support noncontig i32 copy (llama/17328) Jeff Bolz 2025-11-18 00:41:24 -06:00
b7dfced37f vulkan: add log RTE support to fix Nvidia CI (llama/17320) Ruben Ortlam 2025-11-17 21:37:49 +01:00

... 4 5 6 7 8 ...