Artikel ; Online: X
IEEE transactions on pattern analysis and machine intelligence
2024 Band 46, Heft 5, Seite(n) 3156–3168
Abstract: ... grained aligning and multi-grained localization simultaneously. Based on it, we present X ...
Abstract | Vision language pre-training aims to learn alignments between vision and language from a large amount of data. Most existing methods only learn image-text alignments. Some others utilize pre-trained object detectors to leverage vision language alignments at the object level. In this paper, we propose to learn multi-grained vision language alignments by a unified pre-training framework that learns multi-grained aligning and multi-grained localization simultaneously. Based on it, we present X |
---|---|
Sprache | Englisch |
Erscheinungsdatum | 2024-04-03 |
Erscheinungsland | United States |
Dokumenttyp | Journal Article |
ISSN | 1939-3539 |
ISSN (online) | 1939-3539 |
DOI | 10.1109/TPAMI.2023.3339661 |
Datenquelle | MEDical Literature Analysis and Retrieval System OnLINE |
Zusatzmaterialien
Kategorien
Über subito bestellen
Dieser Service ist kostenpflichtig (siehe Lieferbedingungen von subito). Bestellungen, die einen Artikel nebst Supplementary Material umfassen, werden grundsätzlich wie mehrfache Bestellungen bearbeitet. Gebühren fallen in diesen Fällen für jede einzelne Bestellung an.
Fernleihe an ZB MED
Sie können sich den gewünschten Titel als lokale Nutzerin oder lokaler Nutzer von ZB MED direkt an den Standort Köln schicken lassen.