llama-cpp-python

abetlen/llama-cpp-python

Fork 0

mirror of https://github.com/abetlen/llama-cpp-python.git synced 2026-03-28 03:41:34 +00:00

Commit Graph

Select branches

Hide Pull Requests

abetlen/bump-version-0.3.18

abetlen/fix-cuda-real-arch

abetlen/fix-hf-download-checks

abetlen/fix-macos-runner-label

abetlen/setup-ruff

abetlen/update-llama-cpp-bindings

add-paligemma-support

batch-processing

binary-wheels

dependabot/github_actions/conda-incubator/setup-miniconda-3.1.1

dependabot/github_actions/pypa/cibuildwheel-2.23.2

dependabot/pip/starlette-context-gte-0.3.6-and-lt-0.5

dev-add-rpc

docker

expose-libggml

fix-embeddings-for-non-embedding-models

fix-windows-import-error

generic-vlm-chat-format

main

patch-1

patch-3

remove-unwanted-bos

update-sampling-api

#10

#1002

#1005

#1007

#1010

#1011

#1012

#1015

#1019

#1021

#1023

#1028

#1037

#1050

#1052

#1058

#1059

#1067

#1067

#1068

#1078

#108

#1080

#1080

#1086

#1087

#1088

#1090

#1092

#1093

#1106

#1106

#111

#1110

#1115

#1116

#1120

#1122

#1131

#1136

#1147

#1156

#1157

#1160

#1160

#1170

#1170

#1172

#1175

#1176

#1179

#118

#1184

#1186

#1187

#1188

#119

#1193

#1194

#1205

#1206

#1209

#1209

#1210

#1212

#1212

#1214

#1222

#1230

#1232

#1244

#1246

#1247

#1248

#125

#1257

#126

#1263

#1264

#1272

#1273

#1281

#1281

#1282

#1289

#1295

#1296

#130

#1307

#1311

#1317

#1330

#1331

#1331

#1333

#1345

#1347

#135

#1350

#1351

#1351

#1353

#1364

#137

#1370

#1371

#1374

#1374

#1375

#1380

#1382

#1382

#1383

#1383

#1385

#1386

#1387

#1388

#139

#1390

#1391

#1392

#1396

#1397

#1398

#1399

#140

#1400

#1401

#1407

#1407

#1408

#1409

#1410

#1411

#1412

#1413

#1415

#1416

#1419

#1424

#1426

#1427

#1427

#1430

#1432

#1433

#1434

#1439

#144

#144

#1440

#1440

#1441

#1444

#1448

#1449

#1453

#1457

#1459

#146

#146

#1462

#1465

#1471

#1472

#1476

#1477

#1486

#1486

#1492

#1493

#1497

#15

#1503

#1503

#1509

#1509

#1513

#1514

#1515

#1515

#1516

#1522

#1525

#1526

#1527

#153

#1530

#1539

#154

#1544

#1550

#1550

#1551

#1552

#1552

#156

#1568

#1569

#157

#1576

#1583

#1583

#1585

#1589

#1590

#1594

#1596

#1597

#160

#1605

#1605

#161

#1613

#1613

#162

#1626

#163

#1630

#1632

#1633

#1634

#1635

#1637

#164

#1649

#165

#1651

#1651

#1653

#1656

#1657

#1658

#1659

#1667

#1668

#1673

#1677

#1677

#1679

#168

#1680

#1704

#1716

#1716

#1718

#1718

#172

#172

#1721

#173

#1738

#1739

#1739

#1741

#1742

#1743

#1750

#1751

#1758

#1758

#176

#176

#1761

#177

#1775

#1776

#1776

#1777

#1777

#178

#1782

#1782

#1783

#1786

#1786

#1788

#1790

#1791

#1791

#1793

#1795

#1796

#1798

#1800

#1800

#1802

#1807

#1817

#1817

#1819

#1820

#1820

#1821

#1825

#1825

#1833

#1834

#1834

#1838

#1842

#1842

#1843

#1843

#1844

#1845

#1858

#1862

#1864

#1864

#1867

#1867

#1871

#1877

#1877

#1878

#1878

#1879

#1884

#1884

#1887

#1887

#189

#1894

#1898

#1899

#1899

#190

#1901

#191

#1911

#1911

#1912

#1959

#1961

#1961

#1966

#1971

#1971

#1973

#1974

#1978

#198

#198

#1980

#1981

#1981

#1989

#1989

#1991

#1991

#2007

#2007

#2009

#2015

#2015

#2018

#2018

#2025

#2025

#2027

#203

#2030

#2034

#2034

#2039

#2039

#2040

#2041

#2041

#2042

#2042

#2044

#2044

#2046

#2049

#2056

#2056

#2058

#2058

#2059

#2059

#2066

#2066

#2071

#2071

#2072

#2072

#2077

#2082

#2082

#2083

#2083

#2085

#2085

#2088

#2088

#2099

#2099

#2100

#2102

#2102

#2108

#2108

#2109

#2109

#2112

#212

#2120

#2120

#2121

#2121

#2128

#2128

#2129

#2129

#2131

#2131

#2132

#2133

#2134

#2134

#2139

#214

#2141

#2141

#2143

#2147

#2147

#2148

#2149

#215

#2150

#2151

#2152

#2153

#2154

#2155

#2156

#2157

#2158

#2160

#2161

#2162

#2164

#2164

#217

#225

#235

#240

#246

#248

#249

#251

#252

#258

#262

#263

#264

#265

#270

#271

#274

#277

#28

#289

#29

#292

#293

#294

#295

#296

#297

#309

#310

#322

#323

#324

#325

#326

#328

#329

#329

#350

#351

#359

#360

#365

#366

#367

#368

#370

#376

#385

#390

#392

#402

#405

#41

#414

#414

#415

#42

#420

#429

#430

#431

#432

#435

#436

#442

#443

#444

#452

#453

#456

#460

#466

#481

#485

#486

#498

#499

#50

#501

#505

#505

#508

#511

#516

#517

#517

#521

#522

#523

#525

#530

#531

#532

#536

#540

#540

#548

#549

#55

#550

#551

#556

#564

#565

#567

#572

#573

#575

#575

#577

#583

#584

#594

#594

#598

#600

#604

#61

#610

#611

#612

#621

#624

#624

#625

#63

#631

#631

#633

#64

#644

#647

#648

#667

#668

#669

#670

#671

#678

#678

#680

#682

#684

#688

#690

#691

#692

#694

#694

#703

#704

#705

#709

#709

#711

#713

#716

#716

#73

#730

#733

#733

#748

#752

#752

#76

#767

#768

#772

#778

#781

#783

#784

#790

#795

#798

#799

#803

#808

#809

#820

#821

#824

#824

#826

#83

#834

#835

#842

#843

#843

#846

#848

#849

#850

#851

#854

#855

#864

#868

#868

#869

#87

#875

#892

#913

#913

#920

#921

#922

#922

#925

#927

#93

#930

#931

#934

#936

#937

#938

#940

#947

#951

#951

#952

#955

#955

#957

#958

#961

#962

#962

#967

#98

#986

#991

#993

#993

#994

#996

v0.1.29

v0.1.30

v0.1.31

v0.1.32

v0.1.33

v0.1.34

v0.1.35

v0.1.36

v0.1.37

v0.1.38

v0.1.39

v0.1.40

v0.1.41

v0.1.42

v0.1.43

v0.1.44

v0.1.45

v0.1.46

v0.1.47

v0.1.48

v0.1.49

v0.1.50

v0.1.51

v0.1.52

v0.1.53

v0.1.54

v0.1.55

v0.1.56

v0.1.57

v0.1.59

v0.1.60

v0.1.61

v0.1.62

v0.1.63

v0.1.64

v0.1.65

v0.1.66

v0.1.67

v0.1.68

v0.1.69

v0.1.70

v0.1.71

v0.1.72

v0.1.73

v0.1.74

v0.1.75

v0.1.76

v0.1.77

v0.1.78

v0.1.79

v0.1.80

v0.1.81

v0.1.82

v0.1.83

v0.1.84

v0.1.85

v0.2.0

v0.2.1

v0.2.10

v0.2.11

v0.2.12

v0.2.13

v0.2.14

v0.2.15

v0.2.16

v0.2.17

v0.2.18

v0.2.19

v0.2.2

v0.2.20

v0.2.21

v0.2.22

v0.2.23

v0.2.24

v0.2.25

v0.2.26

v0.2.27

v0.2.28

v0.2.29

v0.2.3

v0.2.30

v0.2.31

v0.2.32

v0.2.33

v0.2.34

v0.2.35

v0.2.36

v0.2.37

v0.2.38

v0.2.39

v0.2.4

v0.2.40

v0.2.41

v0.2.42

v0.2.43

v0.2.44

v0.2.45

v0.2.46

v0.2.47

v0.2.48

v0.2.49

v0.2.5

v0.2.50

v0.2.51

v0.2.52

v0.2.53

v0.2.54

v0.2.55

v0.2.56

v0.2.57

v0.2.58

v0.2.59

v0.2.59-cu121

v0.2.59-cu122

v0.2.59-cu123

v0.2.59-metal

v0.2.6

v0.2.60

v0.2.60-cu121

v0.2.60-cu122

v0.2.60-cu123

v0.2.60-metal

v0.2.61

v0.2.61-cu121

v0.2.61-cu122

v0.2.61-cu123

v0.2.61-metal

v0.2.62

v0.2.62-cu121

v0.2.62-cu122

v0.2.62-cu123

v0.2.62-metal

v0.2.63

v0.2.63-cu121

v0.2.63-cu122

v0.2.63-cu123

v0.2.63-metal

v0.2.64

v0.2.64-cu121

v0.2.64-cu122

v0.2.64-cu123

v0.2.64-metal

v0.2.65

v0.2.65-cu121

v0.2.65-cu122

v0.2.65-cu123

v0.2.65-metal

v0.2.66

v0.2.66-cu121

v0.2.66-cu122

v0.2.66-cu123

v0.2.66-cu124

v0.2.66-metal

v0.2.67

v0.2.67-cu121

v0.2.67-cu122

v0.2.67-cu123

v0.2.67-cu124

v0.2.67-metal

v0.2.68

v0.2.68-cu121

v0.2.68-cu122

v0.2.68-cu123

v0.2.68-cu124

v0.2.68-metal

v0.2.69

v0.2.69-cu121

v0.2.69-cu122

v0.2.69-cu123

v0.2.69-cu124

v0.2.69-metal

v0.2.7

v0.2.70

v0.2.70-cu121

v0.2.70-cu122

v0.2.70-cu123

v0.2.70-cu124

v0.2.70-metal

v0.2.71

v0.2.71-cu121

v0.2.71-cu122

v0.2.71-cu123

v0.2.71-cu124

v0.2.71-metal

v0.2.72

v0.2.72-cu121

v0.2.72-cu122

v0.2.72-cu123

v0.2.72-cu124

v0.2.72-metal

v0.2.73

v0.2.73-cu121

v0.2.73-cu122

v0.2.73-cu123

v0.2.73-cu124

v0.2.73-metal

v0.2.74

v0.2.74-cu121

v0.2.74-cu122

v0.2.74-cu123

v0.2.74-cu124

v0.2.74-metal

v0.2.75

v0.2.75-cu121

v0.2.75-cu122

v0.2.75-cu123

v0.2.75-cu124

v0.2.75-metal

v0.2.76

v0.2.76-cu121

v0.2.76-cu122

v0.2.76-cu123

v0.2.76-cu124

v0.2.76-metal

v0.2.77

v0.2.77-cu121

v0.2.77-cu122

v0.2.77-cu123

v0.2.77-cu124

v0.2.77-metal

v0.2.78

v0.2.78-metal

v0.2.79

v0.2.79-metal

v0.2.8

v0.2.80

v0.2.80-metal

v0.2.81

v0.2.81-cu121

v0.2.81-cu122

v0.2.81-cu123

v0.2.81-cu124

v0.2.81-metal

v0.2.82

v0.2.82-cu121

v0.2.82-cu122

v0.2.82-cu123

v0.2.82-cu124

v0.2.82-metal

v0.2.83

v0.2.83-cu121

v0.2.83-cu122

v0.2.83-cu123

v0.2.83-cu124

v0.2.83-metal

v0.2.84

v0.2.84-cu121

v0.2.84-cu122

v0.2.84-cu123

v0.2.84-cu124

v0.2.84-metal

v0.2.85

v0.2.85-cu121

v0.2.85-cu122

v0.2.85-cu123

v0.2.85-cu124

v0.2.85-metal

v0.2.86

v0.2.86-cu121

v0.2.86-cu122

v0.2.86-cu123

v0.2.86-cu124

v0.2.86-metal

v0.2.87

v0.2.87-cu121

v0.2.87-cu122

v0.2.87-cu123

v0.2.87-cu124

v0.2.87-metal

v0.2.88

v0.2.88-cu121

v0.2.88-cu122

v0.2.88-cu123

v0.2.88-cu124

v0.2.88-metal

v0.2.89

v0.2.89-cu121

v0.2.89-cu124

v0.2.89-metal

v0.2.9

v0.2.90

v0.2.90-cu121

v0.2.90-cu122

v0.2.90-cu123

v0.2.90-cu124

v0.2.90-metal

v0.3.0

v0.3.0-metal

v0.3.1

v0.3.1-metal

v0.3.10

v0.3.11

v0.3.11-metal

v0.3.12

v0.3.12-cu121

v0.3.12-cu122

v0.3.12-cu123

v0.3.12-cu124

v0.3.12-metal

v0.3.13

v0.3.13-cu121

v0.3.13-cu122

v0.3.13-cu123

v0.3.13-cu124

v0.3.13-metal

v0.3.14

v0.3.14-cu124

v0.3.14-metal

v0.3.15

v0.3.15-cu121

v0.3.15-cu122

v0.3.15-cu123

v0.3.15-cu124

v0.3.15-metal

v0.3.16

v0.3.16-cu121

v0.3.16-cu122

v0.3.16-cu123

v0.3.16-cu124

v0.3.16-metal

v0.3.17

v0.3.17-metal

v0.3.18

v0.3.18-cu121

v0.3.18-cu122

v0.3.18-cu123

v0.3.18-cu124

v0.3.18-metal

v0.3.19

v0.3.19-cu121

v0.3.19-cu122

v0.3.19-cu123

v0.3.19-cu124

v0.3.19-metal

v0.3.2

v0.3.2-metal

v0.3.3

v0.3.4

v0.3.4-cu121

v0.3.4-cu122

v0.3.4-cu123

v0.3.4-cu124

v0.3.4-metal

v0.3.5

v0.3.5-metal

v0.3.6

v0.3.7

v0.3.8

v0.3.9

296304b60b fix(server): Fix bug in FastAPI streaming response where dependency was released before request completes causing SEGFAULT Andrei Betlen 2024-07-02 02:49:20 -04:00
dc20e8c342 fix: Copy dependencies for windows Andrei Betlen 2024-07-01 23:28:19 -04:00
73fe013a48 fix: Fix RPATH so it works on macos Andrei Betlen 2024-07-01 23:17:02 -04:00
e51f200f2c fix: Fix installation location for shared libraries Andrei Betlen 2024-07-01 23:11:49 -04:00
d5f6a15a9b fix: force $ORIGIN rpath for shared library files Andrei Betlen 2024-07-01 23:03:26 -04:00
139774b8b0 fix: Update shared library rpath Andrei Betlen 2024-07-01 22:21:34 -04:00
92bad6e510 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main Andrei Betlen 2024-07-01 22:03:21 -04:00
c546c94b48 misc: Install shared libraries to lib subdirectory Andrei Betlen 2024-07-01 22:03:19 -04:00
73ddf297be fix(ci): Fix the CUDA workflow (#1551) oobabooga 2024-07-01 22:31:25 -03:00
bf5e0bb4b1 fix(server): Update embeddings=False by default. Embeddings should be enabled by default for embedding models. Andrei Betlen 2024-07-01 21:29:13 -04:00
117cbb2f53 feat: Update llama.cpp Andrei Betlen 2024-07-01 21:28:11 -04:00
19e3a54f0a Merge branch 'main' into docker Olivier DEBAUCHE 2024-06-23 03:40:28 +02:00
04959f1884 feat: Update llama_cpp.py bindings Andrei Betlen 2024-06-21 16:56:15 -04:00
35c980eb2e chore(deps): bump pypa/cibuildwheel from 2.18.1 to 2.19.1 (#1527) dependabot[bot] 2024-06-21 12:10:43 -04:00
398fe81547 chore(deps): bump docker/build-push-action from 5 to 6 (#1539) dependabot[bot] 2024-06-21 12:10:34 -04:00
27d53589ff docs: Update readme examples to use newer Qwen2 model (#1544) Jon Craton 2024-06-21 12:10:15 -04:00
5beec1a1fd feat: Update llama.cpp Andrei Betlen 2024-06-21 12:09:14 -04:00
d98a24a25b docs: Remove references to deprecated opencl backend. Closes #1512 Andrei Betlen 2024-06-20 10:50:40 -04:00
6c331909ca chore: Bump version v0.2.79-metal v0.2.79 Andrei Betlen 2024-06-19 10:10:01 -04:00
554fd08e7d feat: Update llama.cpp Andrei Betlen 2024-06-19 10:07:28 -04:00
4c1d74c0ae fix: Make destructor to automatically call .close() method on Llama class. Andrei Betlen 2024-06-19 10:07:20 -04:00
f4491c4903 feat: Update llama.cpp Andrei Betlen 2024-06-17 11:56:03 -04:00
ed15d2e1a3 Update Dockerfile Olivier DEBAUCHE 2024-06-16 05:11:01 +02:00
7c086bafc5 Update Dockerfile Olivier DEBAUCHE 2024-06-16 05:10:28 +02:00
4db6bb5d31 Update build-docker.yaml Olivier DEBAUCHE 2024-06-14 16:07:26 +02:00
e74b6592ce Update Dockerfile Olivier DEBAUCHE 2024-06-14 15:43:05 +02:00
c4919f034c Update Dockerfile Olivier DEBAUCHE 2024-06-14 15:42:39 +02:00
67a314f680 Update Dockerfile Olivier DEBAUCHE 2024-06-14 15:41:11 +02:00
2bea4f3ff0 Update Dockerfile Olivier DEBAUCHE 2024-06-14 15:37:03 +02:00
acfd90a8dc Update Dockerfile Olivier DEBAUCHE 2024-06-14 15:36:32 +02:00
299ad0dbfa Update Dockerfile Olivier DEBAUCHE 2024-06-14 15:36:13 +02:00
7a1ca4ec0a Update Dockerfile Olivier DEBAUCHE 2024-06-14 15:18:44 +02:00
8401c6f2d1 feat: Update llama.cpp Andrei Betlen 2024-06-13 11:31:31 -04:00
9e396b3ebd feat: Update workflows and pre-built wheels (#1416) Olivier DEBAUCHE 2024-06-13 16:19:57 +02:00
5af81634cb chore(deps): bump pypa/cibuildwheel from 2.18.1 to 2.19.0 (#1522) dependabot[bot] 2024-06-13 10:12:02 -04:00
320a5d7ea5 feat: Add .close() method to Llama class to explicitly free model from memory (#1513) Junpei Kawamoto 2024-06-13 02:16:14 -06:00
dbcf64cf07 feat: Support SPM infill (#1492) Sigbjørn Skjæret 2024-06-13 09:45:24 +02:00
e342161371 feat: Update llama.cpp Andrei Betlen 2024-06-13 03:38:11 -04:00
86a38ad4a0 chore: Bump version v0.2.78-metal v0.2.78 Andrei Betlen 2024-06-10 11:14:33 -04:00
1615eb9e5b feat: Update llama.cpp Andrei Betlen 2024-06-10 11:05:45 -04:00
83d6b26e6f feat: Update llama.cpp Andrei Betlen 2024-06-08 23:14:22 -04:00
255e1b4495 feat: Update llama.cpp Andrei Betlen 2024-06-07 02:02:12 -04:00
d634efcdd9 feat: adding rpc_servers parameter to Llama class (#1477) v0.2.77-cu124 v0.2.77-cu123 v0.2.77-cu122 v0.2.77-cu121 nullname 2024-06-04 22:38:21 +08:00
2b5438d71b Add rpc servers to server options dev-add-rpc Andrei Betlen 2024-06-04 10:37:20 -04:00
1e42468a27 Only set rpc_servers when provided Andrei Betlen 2024-06-04 10:37:02 -04:00
6e0642ca19 fix: fix logprobs when BOS is not present (#1471) Asghar Ghorbani 2024-06-04 16:18:38 +02:00
027f7bc678 fix: Avoid duplicate special tokens in chat formats (#1439) Sigbjørn Skjæret 2024-06-04 16:15:41 +02:00
71805353ef Use python warnings module remove-unwanted-bos Andrei Betlen 2024-06-04 10:13:15 -04:00
9f14fd29ab Merge branch 'main' into remove-unwanted-bos Andrei Betlen 2024-06-04 10:09:29 -04:00
ff88fcbc20 update readme hongruichen 2024-05-29 12:18:51 +08:00
aeebfba860 Revert "enable llama rpc by default" hongruichen 2024-05-23 10:09:27 +08:00
2f7f83e121 add rpc package hongruichen 2024-05-22 21:12:43 +08:00
fd7bcc951d convert string to byte hongruichen 2024-05-21 23:18:04 +08:00
9e1d80f1d0 enable llama rpc by default hongruichen 2024-05-21 22:42:38 +08:00
e8b4f32da3 passthru rpc_servers params hongruichen 2024-05-21 22:41:43 +08:00
951e39caf9 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main v0.2.77-metal v0.2.77 Andrei Betlen 2024-06-04 00:49:26 -04:00
c3ef41ba06 chore: Bump version Andrei Betlen 2024-06-04 00:49:24 -04:00
ae5682f500 fix: Disable Windows+CUDA workaround when compiling for HIPBLAS (#1493) Engininja2 2024-06-03 22:42:34 -06:00
cd3f1bb387 feat: Update llama.cpp Andrei Betlen 2024-06-04 00:35:47 -04:00
6b018e00b1 misc: Improve llava error messages Andrei Betlen 2024-06-03 11:19:10 -04:00
a6457ba74b Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main Andrei Betlen 2024-06-01 18:10:13 -04:00
af3ed503e9 fix: Use numpy recarray for candidates data, fixes bug with temp < 0 Andrei Betlen 2024-06-01 18:09:24 -04:00
a6e5917ca4 move to another PR Sigbjørn Skjæret 2024-05-29 20:24:42 +02:00
165b4dc6c1 fix: Fix typo in Llama3VisionAlphaChatHandler. Closes #1488 Andrei Betlen 2024-05-29 02:29:44 -04:00
91d05aba46 fix: adjust kv_override member names to match llama.cpp Andrei Betlen 2024-05-29 02:28:58 -04:00
df45a4b3fe fix: fix string value kv_overrides. Closes #1487 Andrei Betlen 2024-05-29 02:02:22 -04:00
10b7c50cd2 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main Andrei Betlen 2024-05-28 22:52:30 -04:00
2907c26906 misc: Update debug build to keep all debug symbols for easier gdb debugging Andrei Betlen 2024-05-28 22:52:28 -04:00
c26004b1be feat: Update llama.cpp Andrei Betlen 2024-05-28 22:52:03 -04:00
c564007ff6 chore(deps): bump pypa/cibuildwheel from 2.18.0 to 2.18.1 (#1472) dependabot[bot] 2024-05-27 10:57:17 -04:00
454c9bb1cb feat: Update llama.cpp Andrei Betlen 2024-05-27 10:51:57 -04:00
2d89964147 docs: Fix table formatting Andrei Betlen 2024-05-24 11:55:41 -04:00
9e8d7d55bd fix(docs): Fix link typo Andrei Betlen 2024-05-24 11:55:01 -04:00
ec43e8920f docs: Update multi-modal model section Andrei Betlen 2024-05-24 11:54:15 -04:00
a4c9ab885d chore: Bump version v0.2.76-metal v0.2.76-cu124 v0.2.76-cu123 v0.2.76-cu122 v0.2.76-cu121 v0.2.76 Andrei Betlen 2024-05-24 01:59:25 -04:00
5cae1040e3 feat: Improve Llama.eval performance by avoiding list conversion (#1476) Linghan Zhong 2024-05-24 00:49:44 -05:00
087cc0b036 feat: Update llama.cpp Andrei Betlen 2024-05-24 01:43:36 -04:00
b9a1e61f24 changed to a warning Sigbjørn Skjæret 2024-05-22 11:21:34 +02:00
5a595f035a feat: Update llama.cpp Andrei Betlen 2024-05-22 02:40:31 -04:00
3dbfec74e7 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main Andrei Betlen 2024-05-18 01:19:20 -04:00
d8a3b013c3 feat: Update llama.cpp Andrei Betlen 2024-05-18 01:19:19 -04:00
03f171e810 example: LLM inference with Ray Serve (#1465) Radoslav Gerganov 2024-05-17 20:27:26 +03:00
b564d05806 chore: Bump version v0.2.75-metal v0.2.75-cu124 v0.2.75-cu123 v0.2.75-cu122 v0.2.75-cu121 v0.2.75 Andrei Betlen 2024-05-16 00:41:21 -04:00
d99a6ba607 fix: segfault for models without eos / bos tokens. Closes #1463 Andrei Betlen 2024-05-16 00:37:27 -04:00
e811a81066 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main Andrei Betlen 2024-05-15 23:59:18 -04:00
ca8e3c967d feat: Update llama.cpp Andrei Betlen 2024-05-15 23:59:17 -04:00
5212fb08ae feat: add MinTokensLogitProcessor and min_tokens argument to server (#1333) twaka 2024-05-14 22:50:53 +09:00
389e09c2f5 misc: Remove unnecessary metadata lookups (#1448) Sigbjørn Skjæret 2024-05-14 15:44:09 +02:00
4b54f79330 chore(deps): bump pypa/cibuildwheel from 2.17.0 to 2.18.0 (#1453) dependabot[bot] 2024-05-14 09:35:52 -04:00
50f5c74ecf Update llama.cpp Andrei Betlen 2024-05-14 09:30:04 -04:00
43ba1526c8 feat: Update llama.cpp Andrei Betlen 2024-05-13 09:39:08 -04:00
3f8e17af63 fix(ci): Use version without extra platform tag in pep503 index Andrei Betlen 2024-05-12 11:45:55 -04:00
3c19faa0d4 chore: Bump version v0.2.74-metal v0.2.74-cu124 v0.2.74-cu123 v0.2.74-cu122 v0.2.74-cu121 v0.2.74 Andrei Betlen 2024-05-12 10:32:52 -04:00
3fe8e9a8f3 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main Andrei Betlen 2024-05-12 10:30:24 -04:00
9dc5e20fb6 feat: Update llama.cpp Andrei Betlen 2024-05-12 10:30:23 -04:00
aef3b1c31a align test with new response Sigbjørn Skjæret 2024-05-11 10:51:34 +02:00
aa25cd3dbb typo-- Sigbjørn Skjæret 2024-05-11 10:44:28 +02:00
2e26f2d4d1 just let tokenizer do the job Sigbjørn Skjæret 2024-05-11 10:42:37 +02:00
bb6cf4f913 proper bos/eos detection Sigbjørn Skjæret 2024-05-11 10:27:13 +02:00
06cf25d1ed add some missing internals Sigbjørn Skjæret 2024-05-11 09:49:18 +02:00

... 2 3 4 5 6 ...