llama-cpp-python

abetlen/llama-cpp-python

Fork 0

mirror of https://github.com/abetlen/llama-cpp-python.git synced 2026-03-28 03:41:34 +00:00

Commit Graph

Select branches

Hide Pull Requests

abetlen/bump-version-0.3.18

abetlen/fix-cuda-real-arch

abetlen/fix-hf-download-checks

abetlen/fix-macos-runner-label

abetlen/setup-ruff

abetlen/update-llama-cpp-bindings

add-paligemma-support

batch-processing

binary-wheels

dependabot/github_actions/conda-incubator/setup-miniconda-3.1.1

dependabot/github_actions/pypa/cibuildwheel-2.23.2

dependabot/pip/starlette-context-gte-0.3.6-and-lt-0.5

dev-add-rpc

docker

expose-libggml

fix-embeddings-for-non-embedding-models

fix-windows-import-error

generic-vlm-chat-format

main

patch-1

patch-3

remove-unwanted-bos

update-sampling-api

#10

#1002

#1005

#1007

#1010

#1011

#1012

#1015

#1019

#1021

#1023

#1028

#1037

#1050

#1052

#1058

#1059

#1067

#1067

#1068

#1078

#108

#1080

#1080

#1086

#1087

#1088

#1090

#1092

#1093

#1106

#1106

#111

#1110

#1115

#1116

#1120

#1122

#1131

#1136

#1147

#1156

#1157

#1160

#1160

#1170

#1170

#1172

#1175

#1176

#1179

#118

#1184

#1186

#1187

#1188

#119

#1193

#1194

#1205

#1206

#1209

#1209

#1210

#1212

#1212

#1214

#1222

#1230

#1232

#1244

#1246

#1247

#1248

#125

#1257

#126

#1263

#1264

#1272

#1273

#1281

#1281

#1282

#1289

#1295

#1296

#130

#1307

#1311

#1317

#1330

#1331

#1331

#1333

#1345

#1347

#135

#1350

#1351

#1351

#1353

#1364

#137

#1370

#1371

#1374

#1374

#1375

#1380

#1382

#1382

#1383

#1383

#1385

#1386

#1387

#1388

#139

#1390

#1391

#1392

#1396

#1397

#1398

#1399

#140

#1400

#1401

#1407

#1407

#1408

#1409

#1410

#1411

#1412

#1413

#1415

#1416

#1419

#1424

#1426

#1427

#1427

#1430

#1432

#1433

#1434

#1439

#144

#144

#1440

#1440

#1441

#1444

#1448

#1449

#1453

#1457

#1459

#146

#146

#1462

#1465

#1471

#1472

#1476

#1477

#1486

#1486

#1492

#1493

#1497

#15

#1503

#1503

#1509

#1509

#1513

#1514

#1515

#1515

#1516

#1522

#1525

#1526

#1527

#153

#1530

#1539

#154

#1544

#1550

#1550

#1551

#1552

#1552

#156

#1568

#1569

#157

#1576

#1583

#1583

#1585

#1589

#1590

#1594

#1596

#1597

#160

#1605

#1605

#161

#1613

#1613

#162

#1626

#163

#1630

#1632

#1633

#1634

#1635

#1637

#164

#1649

#165

#1651

#1651

#1653

#1656

#1657

#1658

#1659

#1667

#1668

#1673

#1677

#1677

#1679

#168

#1680

#1704

#1716

#1716

#1718

#1718

#172

#172

#1721

#173

#1738

#1739

#1739

#1741

#1742

#1743

#1750

#1751

#1758

#1758

#176

#176

#1761

#177

#1775

#1776

#1776

#1777

#1777

#178

#1782

#1782

#1783

#1786

#1786

#1788

#1790

#1791

#1791

#1793

#1795

#1796

#1798

#1800

#1800

#1802

#1807

#1817

#1817

#1819

#1820

#1820

#1821

#1825

#1825

#1833

#1834

#1834

#1838

#1842

#1842

#1843

#1843

#1844

#1845

#1858

#1862

#1864

#1864

#1867

#1867

#1871

#1877

#1877

#1878

#1878

#1879

#1884

#1884

#1887

#1887

#189

#1894

#1898

#1899

#1899

#190

#1901

#191

#1911

#1911

#1912

#1959

#1961

#1961

#1966

#1971

#1971

#1973

#1974

#1978

#198

#198

#1980

#1981

#1981

#1989

#1989

#1991

#1991

#2007

#2007

#2009

#2015

#2015

#2018

#2018

#2025

#2025

#2027

#203

#2030

#2034

#2034

#2039

#2039

#2040

#2041

#2041

#2042

#2042

#2044

#2044

#2046

#2049

#2056

#2056

#2058

#2058

#2059

#2059

#2066

#2066

#2071

#2071

#2072

#2072

#2077

#2082

#2082

#2083

#2083

#2085

#2085

#2088

#2088

#2099

#2099

#2100

#2102

#2102

#2108

#2108

#2109

#2109

#2112

#212

#2120

#2120

#2121

#2121

#2128

#2128

#2129

#2129

#2131

#2131

#2132

#2133

#2134

#2134

#2139

#214

#2141

#2141

#2143

#2147

#2147

#2148

#2149

#215

#2150

#2151

#2152

#2153

#2154

#2155

#2156

#2157

#2158

#2160

#2161

#2162

#2164

#2164

#217

#225

#235

#240

#246

#248

#249

#251

#252

#258

#262

#263

#264

#265

#270

#271

#274

#277

#28

#289

#29

#292

#293

#294

#295

#296

#297

#309

#310

#322

#323

#324

#325

#326

#328

#329

#329

#350

#351

#359

#360

#365

#366

#367

#368

#370

#376

#385

#390

#392

#402

#405

#41

#414

#414

#415

#42

#420

#429

#430

#431

#432

#435

#436

#442

#443

#444

#452

#453

#456

#460

#466

#481

#485

#486

#498

#499

#50

#501

#505

#505

#508

#511

#516

#517

#517

#521

#522

#523

#525

#530

#531

#532

#536

#540

#540

#548

#549

#55

#550

#551

#556

#564

#565

#567

#572

#573

#575

#575

#577

#583

#584

#594

#594

#598

#600

#604

#61

#610

#611

#612

#621

#624

#624

#625

#63

#631

#631

#633

#64

#644

#647

#648

#667

#668

#669

#670

#671

#678

#678

#680

#682

#684

#688

#690

#691

#692

#694

#694

#703

#704

#705

#709

#709

#711

#713

#716

#716

#73

#730

#733

#733

#748

#752

#752

#76

#767

#768

#772

#778

#781

#783

#784

#790

#795

#798

#799

#803

#808

#809

#820

#821

#824

#824

#826

#83

#834

#835

#842

#843

#843

#846

#848

#849

#850

#851

#854

#855

#864

#868

#868

#869

#87

#875

#892

#913

#913

#920

#921

#922

#922

#925

#927

#93

#930

#931

#934

#936

#937

#938

#940

#947

#951

#951

#952

#955

#955

#957

#958

#961

#962

#962

#967

#98

#986

#991

#993

#993

#994

#996

v0.1.29

v0.1.30

v0.1.31

v0.1.32

v0.1.33

v0.1.34

v0.1.35

v0.1.36

v0.1.37

v0.1.38

v0.1.39

v0.1.40

v0.1.41

v0.1.42

v0.1.43

v0.1.44

v0.1.45

v0.1.46

v0.1.47

v0.1.48

v0.1.49

v0.1.50

v0.1.51

v0.1.52

v0.1.53

v0.1.54

v0.1.55

v0.1.56

v0.1.57

v0.1.59

v0.1.60

v0.1.61

v0.1.62

v0.1.63

v0.1.64

v0.1.65

v0.1.66

v0.1.67

v0.1.68

v0.1.69

v0.1.70

v0.1.71

v0.1.72

v0.1.73

v0.1.74

v0.1.75

v0.1.76

v0.1.77

v0.1.78

v0.1.79

v0.1.80

v0.1.81

v0.1.82

v0.1.83

v0.1.84

v0.1.85

v0.2.0

v0.2.1

v0.2.10

v0.2.11

v0.2.12

v0.2.13

v0.2.14

v0.2.15

v0.2.16

v0.2.17

v0.2.18

v0.2.19

v0.2.2

v0.2.20

v0.2.21

v0.2.22

v0.2.23

v0.2.24

v0.2.25

v0.2.26

v0.2.27

v0.2.28

v0.2.29

v0.2.3

v0.2.30

v0.2.31

v0.2.32

v0.2.33

v0.2.34

v0.2.35

v0.2.36

v0.2.37

v0.2.38

v0.2.39

v0.2.4

v0.2.40

v0.2.41

v0.2.42

v0.2.43

v0.2.44

v0.2.45

v0.2.46

v0.2.47

v0.2.48

v0.2.49

v0.2.5

v0.2.50

v0.2.51

v0.2.52

v0.2.53

v0.2.54

v0.2.55

v0.2.56

v0.2.57

v0.2.58

v0.2.59

v0.2.59-cu121

v0.2.59-cu122

v0.2.59-cu123

v0.2.59-metal

v0.2.6

v0.2.60

v0.2.60-cu121

v0.2.60-cu122

v0.2.60-cu123

v0.2.60-metal

v0.2.61

v0.2.61-cu121

v0.2.61-cu122

v0.2.61-cu123

v0.2.61-metal

v0.2.62

v0.2.62-cu121

v0.2.62-cu122

v0.2.62-cu123

v0.2.62-metal

v0.2.63

v0.2.63-cu121

v0.2.63-cu122

v0.2.63-cu123

v0.2.63-metal

v0.2.64

v0.2.64-cu121

v0.2.64-cu122

v0.2.64-cu123

v0.2.64-metal

v0.2.65

v0.2.65-cu121

v0.2.65-cu122

v0.2.65-cu123

v0.2.65-metal

v0.2.66

v0.2.66-cu121

v0.2.66-cu122

v0.2.66-cu123

v0.2.66-cu124

v0.2.66-metal

v0.2.67

v0.2.67-cu121

v0.2.67-cu122

v0.2.67-cu123

v0.2.67-cu124

v0.2.67-metal

v0.2.68

v0.2.68-cu121

v0.2.68-cu122

v0.2.68-cu123

v0.2.68-cu124

v0.2.68-metal

v0.2.69

v0.2.69-cu121

v0.2.69-cu122

v0.2.69-cu123

v0.2.69-cu124

v0.2.69-metal

v0.2.7

v0.2.70

v0.2.70-cu121

v0.2.70-cu122

v0.2.70-cu123

v0.2.70-cu124

v0.2.70-metal

v0.2.71

v0.2.71-cu121

v0.2.71-cu122

v0.2.71-cu123

v0.2.71-cu124

v0.2.71-metal

v0.2.72

v0.2.72-cu121

v0.2.72-cu122

v0.2.72-cu123

v0.2.72-cu124

v0.2.72-metal

v0.2.73

v0.2.73-cu121

v0.2.73-cu122

v0.2.73-cu123

v0.2.73-cu124

v0.2.73-metal

v0.2.74

v0.2.74-cu121

v0.2.74-cu122

v0.2.74-cu123

v0.2.74-cu124

v0.2.74-metal

v0.2.75

v0.2.75-cu121

v0.2.75-cu122

v0.2.75-cu123

v0.2.75-cu124

v0.2.75-metal

v0.2.76

v0.2.76-cu121

v0.2.76-cu122

v0.2.76-cu123

v0.2.76-cu124

v0.2.76-metal

v0.2.77

v0.2.77-cu121

v0.2.77-cu122

v0.2.77-cu123

v0.2.77-cu124

v0.2.77-metal

v0.2.78

v0.2.78-metal

v0.2.79

v0.2.79-metal

v0.2.8

v0.2.80

v0.2.80-metal

v0.2.81

v0.2.81-cu121

v0.2.81-cu122

v0.2.81-cu123

v0.2.81-cu124

v0.2.81-metal

v0.2.82

v0.2.82-cu121

v0.2.82-cu122

v0.2.82-cu123

v0.2.82-cu124

v0.2.82-metal

v0.2.83

v0.2.83-cu121

v0.2.83-cu122

v0.2.83-cu123

v0.2.83-cu124

v0.2.83-metal

v0.2.84

v0.2.84-cu121

v0.2.84-cu122

v0.2.84-cu123

v0.2.84-cu124

v0.2.84-metal

v0.2.85

v0.2.85-cu121

v0.2.85-cu122

v0.2.85-cu123

v0.2.85-cu124

v0.2.85-metal

v0.2.86

v0.2.86-cu121

v0.2.86-cu122

v0.2.86-cu123

v0.2.86-cu124

v0.2.86-metal

v0.2.87

v0.2.87-cu121

v0.2.87-cu122

v0.2.87-cu123

v0.2.87-cu124

v0.2.87-metal

v0.2.88

v0.2.88-cu121

v0.2.88-cu122

v0.2.88-cu123

v0.2.88-cu124

v0.2.88-metal

v0.2.89

v0.2.89-cu121

v0.2.89-cu124

v0.2.89-metal

v0.2.9

v0.2.90

v0.2.90-cu121

v0.2.90-cu122

v0.2.90-cu123

v0.2.90-cu124

v0.2.90-metal

v0.3.0

v0.3.0-metal

v0.3.1

v0.3.1-metal

v0.3.10

v0.3.11

v0.3.11-metal

v0.3.12

v0.3.12-cu121

v0.3.12-cu122

v0.3.12-cu123

v0.3.12-cu124

v0.3.12-metal

v0.3.13

v0.3.13-cu121

v0.3.13-cu122

v0.3.13-cu123

v0.3.13-cu124

v0.3.13-metal

v0.3.14

v0.3.14-cu124

v0.3.14-metal

v0.3.15

v0.3.15-cu121

v0.3.15-cu122

v0.3.15-cu123

v0.3.15-cu124

v0.3.15-metal

v0.3.16

v0.3.16-cu121

v0.3.16-cu122

v0.3.16-cu123

v0.3.16-cu124

v0.3.16-metal

v0.3.17

v0.3.17-metal

v0.3.18

v0.3.18-cu121

v0.3.18-cu122

v0.3.18-cu123

v0.3.18-cu124

v0.3.18-metal

v0.3.19

v0.3.19-cu121

v0.3.19-cu122

v0.3.19-cu123

v0.3.19-cu124

v0.3.19-metal

v0.3.2

v0.3.2-metal

v0.3.3

v0.3.4

v0.3.4-cu121

v0.3.4-cu122

v0.3.4-cu123

v0.3.4-cu124

v0.3.4-metal

v0.3.5

v0.3.5-metal

v0.3.6

v0.3.7

v0.3.8

v0.3.9

5f15a3d91c Disable wheel repair command Andrei Betlen 2023-11-10 06:05:42 -05:00
e02d52df29 Try to clean before calling cibuildwheel Andrei Betlen 2023-11-10 06:01:58 -05:00
ed5a9260f6 Force LD_LIBRARY_PATH Andrei Betlen 2023-11-10 05:54:23 -05:00
2f070afd61 Don't install in editable mode for release Andrei Betlen 2023-11-10 05:45:44 -05:00
e32ecb0516 Fix tests Andrei Betlen 2023-11-10 05:39:42 -05:00
6f0b0b1b84 Fix sampling bug when logits_all=False Andrei Betlen 2023-11-10 05:15:41 -05:00
d9b38e3e3a Potential bugfix for eval Andrei Betlen 2023-11-10 04:41:19 -05:00
52350cc9d7 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main Andrei Betlen 2023-11-10 04:24:51 -05:00
b84d76a844 Fix: add default stop sequence to chatml chat format Andrei Betlen 2023-11-10 04:24:48 -05:00
841f6167cc Add Code Completion section to docs Andrei Betlen 2023-11-10 04:06:14 -05:00
1b376c62b7 Update functionary for new OpenAI API Andrei Betlen 2023-11-10 02:51:58 -05:00
17da8fb446 Add missing tool_calls finish_reason Andrei Betlen 2023-11-10 02:51:06 -05:00
770df34436 Add $ref and $defs support to json schema converter Andrei Betlen 2023-11-10 02:50:46 -05:00
faeae181b1 Fix: json_schema_to_gbnf should take string dump of json schema as input Andrei Betlen 2023-11-10 02:50:17 -05:00
e7962d2c73 Fix: default max_tokens matches openai api (16 for completion, max length for chat completion) Andrei Betlen 2023-11-10 02:49:27 -05:00
82072802ea Add link to bakllava gguf model Andrei Betlen 2023-11-09 03:05:18 -05:00
baeb7b34b3 Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2023-11-09 00:55:25 -05:00
b62c449839 Bugfix: missing response_format for functionary and llava chat handlers Andrei Betlen 2023-11-09 00:55:23 -05:00
fb1f956a27 Fix server doc arguments (#892) Kevin Jung 2023-11-08 23:53:00 -05:00
80f4162bf4 Update llama.cpp Andrei Betlen 2023-11-08 11:18:15 -05:00
fd41ed3a90 Add set_seed to Llama class Andrei Betlen 2023-11-08 11:09:41 -05:00
ca4cb88351 Fix destructor NoneType is not callable error Andrei Betlen 2023-11-08 11:05:45 -05:00
01cb3a0381 Bump version v0.2.15 Andrei Betlen 2023-11-08 00:54:54 -05:00
9ae9c86be0 Update server docs Andrei Betlen 2023-11-08 00:52:13 -05:00
598780fde8 Update Multimodal notebook Andrei Betlen 2023-11-08 00:48:25 -05:00
b30b9c338b Add JSON mode support. Closes #881 Andrei Betlen 2023-11-08 00:07:16 -05:00
4852a6a39c Fix built in GBNF grammar rules Andrei Betlen 2023-11-08 00:06:22 -05:00
64f5153c35 Add seed parameter to chat handlers Andrei Betlen 2023-11-07 23:41:29 -05:00
86aeb9f3a1 Add seed parameter support for completion and chat_completion requests. Closes #884 Andrei Betlen 2023-11-07 23:37:28 -05:00
da1b80285a Update changelog Andrei Betlen 2023-11-07 23:15:26 -05:00
9a8e64d29d Update llama.cpp Andrei Betlen 2023-11-07 23:14:19 -05:00
3660230faa Fix docs multi-modal docs Andrei Betlen 2023-11-07 22:52:08 -05:00
aab74f0b2b Multimodal Support (Llava 1.5) (#821) Damian Stewart 2023-11-08 04:48:51 +01:00
56171cf7bf Bump version v0.2.14 Andrei Betlen 2023-11-06 09:37:55 -05:00
52320c348c Add python 3.12 classifier Andrei Betlen 2023-11-06 09:34:07 -05:00
4286830f16 Add python3.12 tests Andrei Betlen 2023-11-06 09:32:20 -05:00
be0add1b2d Fix type bug Andrei Betlen 2023-11-06 09:30:38 -05:00
e214a58422 Refactor Llama class internals Andrei Betlen 2023-11-06 09:16:36 -05:00
bbffdaebaa Refactor autotokenizer format to reusable function Andrei Betlen 2023-11-06 09:07:27 -05:00
b0e597e46e Pin python version in release Andrei Betlen 2023-11-06 08:56:41 -05:00
4ff8def4d0 #717: Add support for Huggingface Autotokenizer (#790) Joe 2023-11-05 17:06:36 -06:00
3580e2c5df Update llama_chat_format.py (#869) earonesty 2023-11-05 17:00:13 -05:00
f0b30ef7dc Update llama.cpp Andrei Betlen 2023-11-05 16:57:10 -05:00
dccbac82eb Update llama.cpp Andrei Betlen 2023-11-03 18:12:22 -04:00
2ec043af76 Clean up stdout / stderr suppression Andrei Betlen 2023-11-03 13:02:15 -04:00
4ea7027c41 Rename internal only module utils to _utils Andrei Betlen 2023-11-03 12:55:55 -04:00
df9362eeea Update llama.cpp Andrei Betlen 2023-11-03 11:34:50 -04:00
3af7b21ff1 Add functionary support (#784) Andrei 2023-11-03 02:12:14 -04:00
df31303a12 Update CHANGELOG Andrei Betlen 2023-11-02 20:16:32 -04:00
ab028cb878 Migrate inference to llama_batch and llama_decode api (#795) Andrei 2023-11-02 20:13:57 -04:00
f436e0c872 Update llama.cpp Andrei Betlen 2023-11-02 17:34:01 -04:00
8350de9a18 Bump version v0.2.13 Andrei Betlen 2023-11-02 15:53:01 -04:00
9ffe62d665 Update llama.cpp Andrei Betlen 2023-11-02 15:45:27 -04:00
011b95d7f3 Fix name 'open' is not defined exception. Closes #860 Andrei Betlen 2023-11-02 15:30:55 -04:00
fa83cc5f9c Update llama.cpp Andrei Betlen 2023-11-02 13:40:20 -04:00
ddbd10c442 Fix clblast test Andrei Betlen 2023-11-02 01:17:46 -04:00
735522272b Fix runner label Andrei Betlen 2023-11-01 22:17:53 -04:00
0feffb9c20 Cleanup Andrei Betlen 2023-11-01 21:37:53 -04:00
7fe0bd3a31 Update CHANGELOG Andrei Betlen 2023-11-01 21:31:54 -04:00
4d4e0f11e2 fix: tokenization of special characters: (#850) Antoine Lizee 2023-11-02 01:29:06 +00:00
952e4cc3ce Fix: use linux image for opencl test Andrei Betlen 2023-11-01 21:31:02 -04:00
8bf7fa6e5f Add opencl test Andrei Betlen 2023-11-01 21:18:36 -04:00
446d5f5649 Add metal ci test Andrei Betlen 2023-11-01 21:15:01 -04:00
c89eadafbf Update CHANGELOG Andrei Betlen 2023-11-01 19:40:04 -04:00
6b3aa7fc8f Bump version v0.2.12 Andrei Betlen 2023-11-01 19:25:03 -04:00
3fbcded7cd Add missing n_seq_id to llama_batch (#842) NickAlgra 2023-11-01 23:56:29 +01:00
7b136bb5b1 Fix for shared library not found and compile issues in Windows (#848) Sujeendran Menon 2023-11-02 04:25:57 +05:30
eefd76fe81 llama: fix exception in Llama.__del__ (#846) cebtenzzre 2023-11-01 18:53:57 -04:00
3fc9147218 Iterate over tokens that should be biased rather than the entire vocabulary. (#851) David Ponce 2023-11-01 23:53:47 +01:00
9c8f4dca5f fixed Llama._create_completion suffix check, it can be either None or str instance (#854) Marko Tasic 2023-11-01 23:52:50 +01:00
5f8f369d1b Pass-Through grammar parameter in web server. (#855) Closes #778 Daniel Thuerck 2023-11-01 23:51:12 +01:00
25cb710281 Update llama_types.py (#849) Adam Katora 2023-11-01 18:50:11 -04:00
bdf5254658 Update llama.cpp Andrei Betlen 2023-11-01 14:15:56 -04:00
d808fd436c Update llama.cpp Andrei Betlen 2023-10-31 21:29:35 -04:00
53861c9e53 Update llama.cpp Andrei Betlen 2023-10-24 03:13:32 -04:00
acf50f179a Update llama.cpp Andrei Betlen 2023-10-20 11:17:31 -04:00
5a045fcbbc Update llama.cpp Andrei Betlen 2023-10-19 17:37:07 -04:00
ef03d77b59 Enable finish reason tests Andrei Betlen 2023-10-19 02:56:45 -04:00
09a8406c83 Fix streaming doesn't return finish reason (#798) gmcgoldr 2023-10-19 02:55:56 -04:00
28c2b884e2 Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2023-10-19 02:55:31 -04:00
cbeef36510 Re-enable tests completion function Andrei Betlen 2023-10-19 02:55:29 -04:00
ff580031d2 Update llama.cpp Andrei Betlen 2023-10-19 02:55:08 -04:00
a315128d66 update value check for n_gpu_layers field (#826) Xiaoyu Kevin Hu 2023-10-18 17:25:25 -05:00
d989ac86e6 Update llama.cpp Andrei Betlen 2023-10-15 15:12:57 -04:00
10304d75fc Make use of suppress_stdout_stderr when freeing model (#803) Pierre Alexandre SCHEMBRI 2023-10-15 19:52:43 +02:00
a1ac199980 Fix repeat greeting (#808) Ma, Guokai 2023-10-16 01:52:21 +08:00
b50166500e Add validation for tensor_split size exceeding LLAMA_MAX_DEVICES (#820) Eric Liu 2023-10-15 10:51:51 -07:00
f30aa20126 Update llama.cpp Andrei Betlen 2023-10-12 02:24:50 -04:00
622bff19b2 Update llama.cpp Andrei Betlen 2023-10-10 19:23:35 -04:00
d6a130a052 Print traceback on server error Andrei Betlen 2023-10-10 15:56:04 -04:00
43dfe1e2ab Update llama.cpp Andrei Betlen 2023-10-05 16:07:49 -04:00
2c0456acf0 Update llama.cpp Andrei Betlen 2023-10-04 20:19:31 -04:00
c305be6db6 Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2023-10-03 15:23:37 -04:00
a7d17b8ac9 Update llama.cpp Andrei Betlen 2023-10-03 15:23:35 -04:00
b76724cddc Update instruction to download GGUF model (#783) ccshen 2023-10-02 23:46:47 +08:00
305482bd41 Add chatml chat format Andrei Betlen 2023-09-30 21:01:34 -04:00
5ef5280ef9 Log server exceptions to stdout Andrei Betlen 2023-09-30 19:13:36 -04:00
f0af1c7201 Update llama.cpp Andrei Betlen 2023-09-30 19:09:50 -04:00
fab4bccc35 Bump version v0.2.11 Andrei Betlen 2023-09-30 16:04:46 -04:00
d696251fbe Fix logits_all bug Andrei Betlen 2023-09-30 16:02:35 -04:00

... 9 10 11 12 13 ...