Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Vision OCR
  • Начало работы
  • Управление доступом
  • Правила тарификации
    • Аутентификация в API
        • Overview
          • Overview
          • Recognize
          • GetRecognition
  • История изменений
  • Вопросы и ответы

В этой статье:

  • gRPC request
  • GetRecognitionRequest
  • RecognizeTextResponse
  • TextAnnotation
  • Block
  • Polygon
  • Vertex
  • Line
  • Word
  • TextSegments
  • DetectedLanguage
  • Entity
  • Table
  • TableCell
  1. Справочники API
  2. OCR API (англ.)
  3. gRPC
  4. TextRecognitionAsync
  5. GetRecognition

Vision OCR API, gRPC: TextRecognitionAsyncService.GetRecognition

Статья создана
Yandex Cloud
Обновлена 26 ноября 2024 г.
  • gRPC request
  • GetRecognitionRequest
  • RecognizeTextResponse
  • TextAnnotation
  • Block
  • Polygon
  • Vertex
  • Line
  • Word
  • TextSegments
  • DetectedLanguage
  • Entity
  • Table
  • TableCell

To get recognition results.

gRPC requestgRPC request

rpc GetRecognition (GetRecognitionRequest) returns (stream RecognizeTextResponse)

GetRecognitionRequestGetRecognitionRequest

{
  "operation_id": "string"
}

Field

Description

operation_id

string

Required field. Operation ID of async recognition request.

RecognizeTextResponseRecognizeTextResponse

{
  "text_annotation": {
    "width": "int64",
    "height": "int64",
    "blocks": [
      {
        "bounding_box": {
          "vertices": [
            {
              "x": "int64",
              "y": "int64"
            }
          ]
        },
        "lines": [
          {
            "bounding_box": {
              "vertices": [
                {
                  "x": "int64",
                  "y": "int64"
                }
              ]
            },
            "text": "string",
            "words": [
              {
                "bounding_box": {
                  "vertices": [
                    {
                      "x": "int64",
                      "y": "int64"
                    }
                  ]
                },
                "text": "string",
                "entity_index": "int64",
                "text_segments": [
                  {
                    "start_index": "int64",
                    "length": "int64"
                  }
                ]
              }
            ],
            "text_segments": [
              {
                "start_index": "int64",
                "length": "int64"
              }
            ],
            "orientation": "Angle"
          }
        ],
        "languages": [
          {
            "language_code": "string"
          }
        ],
        "text_segments": [
          {
            "start_index": "int64",
            "length": "int64"
          }
        ]
      }
    ],
    "entities": [
      {
        "name": "string",
        "text": "string"
      }
    ],
    "tables": [
      {
        "bounding_box": {
          "vertices": [
            {
              "x": "int64",
              "y": "int64"
            }
          ]
        },
        "row_count": "int64",
        "column_count": "int64",
        "cells": [
          {
            "bounding_box": {
              "vertices": [
                {
                  "x": "int64",
                  "y": "int64"
                }
              ]
            },
            "row_index": "int64",
            "column_index": "int64",
            "column_span": "int64",
            "row_span": "int64",
            "text": "string",
            "text_segments": [
              {
                "start_index": "int64",
                "length": "int64"
              }
            ]
          }
        ]
      }
    ],
    "full_text": "string",
    "rotate": "Angle"
  },
  "page": "int64"
}

Field

Description

text_annotation

TextAnnotation

Recognized text blocks in page or text from entities.

page

int64

Page number in PDF file.

TextAnnotationTextAnnotation

Field

Description

width

int64

Page width in pixels.

height

int64

Page height in pixels.

blocks[]

Block

Recognized text blocks in this page.

entities[]

Entity

Recognized entities.

tables[]

Table

full_text

string

Full text recognized from image.

rotate

enum Angle

Angle of image rotation.

  • ANGLE_UNSPECIFIED
  • ANGLE_0
  • ANGLE_90
  • ANGLE_180
  • ANGLE_270

BlockBlock

Field

Description

bounding_box

Polygon

Area on the page where the text block is located.

lines[]

Line

Recognized lines in this block.

languages[]

DetectedLanguage

A list of detected languages

text_segments[]

TextSegments

Block position from full_text string.

PolygonPolygon

Field

Description

vertices[]

Vertex

The bounding polygon vertices.

VertexVertex

Field

Description

x

int64

X coordinate in pixels.

y

int64

Y coordinate in pixels.

LineLine

Field

Description

bounding_box

Polygon

Area on the page where the line is located.

text

string

Recognized text.

words[]

Word

Recognized words.

text_segments[]

TextSegments

Line position from full_text string.

orientation

enum Angle

Angle of line rotation.

  • ANGLE_UNSPECIFIED
  • ANGLE_0
  • ANGLE_90
  • ANGLE_180
  • ANGLE_270

WordWord

Field

Description

bounding_box

Polygon

Area on the page where the word is located.

text

string

Recognized word value.

entity_index

int64

ID of the recognized word in entities array.

text_segments[]

TextSegments

Word position from full_text string.

TextSegmentsTextSegments

Field

Description

start_index

int64

Start character position from full_text string.

length

int64

Text segment length.

DetectedLanguageDetectedLanguage

Field

Description

language_code

string

Detected language code.

EntityEntity

Field

Description

name

string

Entity name.

text

string

Recognized entity text.

TableTable

Field

Description

bounding_box

Polygon

Area on the page where the table is located.

row_count

int64

Number of rows in table.

column_count

int64

Number of columns in table.

cells[]

TableCell

Table cells.

TableCellTableCell

Field

Description

bounding_box

Polygon

Area on the page where the table cell is located.

row_index

int64

Row index.

column_index

int64

Column index.

column_span

int64

Column span.

row_span

int64

Row span.

text

string

Text in cell.

text_segments[]

TextSegments

Table cell position from full_text string.

Была ли статья полезна?

Предыдущая
Recognize
Следующая
Overview
Проект Яндекса
© 2025 ООО «Яндекс.Облако»