• Stars
    star
    18
  • Rank 1,208,065 (Top 24 %)
  • Language
    Python
  • Created over 6 years ago
  • Updated about 4 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

Ho Chi Minh is designed to extract textual information from tables presented in PDF, pictures or other format. Хошимин предназначен для извлечения текстовой информации из таблиц, представленных в PDF, картинках или ином формате.

More Repositories

1

CLOPE

Алгоритм кластеризации категориальных данных
Jupyter Notebook
8
star
2

kaggle-parser

This parser will allow you to get all users out of the competition. But you will need a proxy, since kaggle blocks frequent calls to the user service
Python
8
star
3

new-year-contest-boosters

New Year Boosters Contest
Jupyter Notebook
6
star
4

boston-gene

Тестовое задание для BostonGene / Test case for BostonGene
Python
6
star
5

youtube-crawler

This utility allows you to download large amounts of data from YouTube and creates datasets with audio
Python
5
star
6

combinatorial-space

Комбинаторное пространство, реализованное на основе статей А. Редозубова. Combinatorial space, implemented on the basis of A. Redozubov's articles.
Jupyter Notebook
5
star
7

3proxy-docker

This repo has 3proxy docker
Dockerfile
5
star
8

yandex-taxi

Test problem for yandex taxi vacancy
Python
3
star
9

BK-tree

Tree search for string objects. They are used to search for close words according to a certain metric (for example: the Levenshtein distance). Деревья поиска строковых объектов. Применяются для поиска близких слов слогласно некоторой метрике (например: расстояние левенштейна).
Go
3
star
10

awesome-api

Simple api client
Go
2
star
11

Gazprom-Neft-SmartOil-Contest-2-Task-3

Baseline for MAE = 137.2310
Jupyter Notebook
2
star
12

awesome-ml-metrics

Jupyter Notebook
2
star
13

yandex-toloka-parser

This parser extracts all info about your workers via private API
Python
2
star
14

selfie

Python
2
star
15

eurvanov.github.io

1
star
16

decoder

Python
1
star
17

stackoverflow-question-median-937665

Посчитать медиану списка по уникальным значениям
Jupyter Notebook
1
star
18

integration

Simpson's and trapezoidal rule
Jupyter Notebook
1
star
19

table-tests

Simple engine for your tests. No code, no noodles
Python
1
star
20

stackoverflow-question-649761-size-png

Как при помощи ML оценить размер изображения png
Python
1
star
21

cfe

CFE is library for declarative crawling without build DOM tree
Go
1
star
22

awesome-prompts

This repository contains a diverse collection of prompts designed for various tasks, from language learning to problem-solving and more. Each prompt follows a structured approach to ensure clarity and facilitate step-by-step reasoning
1
star
23

squid-proxy-docker

This repo has docker for squid proxy
Shell
1
star
24

fl.ru-4440450

Jupyter Notebook
1
star
25

Optimal-process-planning

An algorithm aimed at optimal processes planning / Алгоритм, нацелнный на оптимальное планирование процессов
Go
1
star
26

itunes-crawler

Python
1
star
27

gpu-cuda-installation

This repo has steps for installing gpu drivers (CUDA)
1
star
28

python-occ-volume

In this repository, I give an example of two ways to calculate volume. I found one of them in the official repository. Other did it myself, as I ran into an error. / В этом репозитории я привожу пример двух способов вычисления объёма. Один из них я нашёл в официальном репозитории. Другой сделал сам, так как столкнулся с ошибкой.
Python
1
star
29

Remove-breakline

If you have a PDF paper and you don't know foreign language, then you can use google translate. Copying text from PDF takes into account the line breaks therefore this script remove them . Then google translate works better. Если у вас есть документ в формате PDF, и вы не знаете иностранный язык, вы можете использовать перевод Google. Копирование текста из PDF учитывает разрывы строк, поэтому этот скрипт удаляет их. Тогда google translate работает лучше.
Python
1
star
30

factorization

This repository is an algorithm that allows you to decompose the number of a given set of numbers / Данный репозиторий представляет собой алгоритм, позволяющий разложить число по заданному множеству чисел
Python
1
star
31

shurigin-algorithm

This algorithm allows one to calculate the mean values for a one-dimensional sample in the presence of outliers or their absence / Этот алгоритм позволяет вычислять среднее значения для одномерной выборки при наличии выбросов или их отсутсвии
Jupyter Notebook
1
star