ViTEraser: Harnessing the Power of Vision Transformers for Scene Text Removal with SegMIM Pretraining

researchr

You are not signed in
Sign in
Sign up

Dezhi Peng, Chongyu Liu, Yuliang Liu, Lianwen Jin. ViTEraser: Harnessing the Power of Vision Transformers for Scene Text Removal with SegMIM Pretraining. In Michael J. Wooldridge, Jennifer G. Dy, Sriraam Natarajan, editors, Thirty-Eigth AAAI Conference on Artificial Intelligence, AAAI 2024, Thirty-Sixth Conference on Innovative Applications of Artificial Intelligence, IAAI 2024, Fourteenth Symposium on Educational Advances in Artificial Intelligence, EAAI 2014, February 20-27, 2024, Vancouver, Canada. pages 4468-4477, AAAI Press, 2024. [doi]

@inproceedings{PengLLJ24,
  title = {ViTEraser: Harnessing the Power of Vision Transformers for Scene Text Removal with SegMIM Pretraining},
  author = {Dezhi Peng and Chongyu Liu and Yuliang Liu and Lianwen Jin},
  year = {2024},
  doi = {10.1609/aaai.v38i5.28245},
  url = {https://doi.org/10.1609/aaai.v38i5.28245},
  researchr = {https://researchr.org/publication/PengLLJ24},
  cites = {0},
  citedby = {0},
  pages = {4468-4477},
  booktitle = {Thirty-Eigth AAAI Conference on Artificial Intelligence, AAAI 2024, Thirty-Sixth Conference on Innovative Applications of Artificial Intelligence, IAAI 2024, Fourteenth Symposium on Educational Advances in Artificial Intelligence, EAAI 2014, February 20-27, 2024, Vancouver, Canada},
  editor = {Michael J. Wooldridge and Jennifer G. Dy and Sriraam Natarajan},
  publisher = {AAAI Press},
}

External Links

Cite Key

Statistics

PDF

Researchr

ViTEraser: Harnessing the Power of Vision Transformers for Scene Text Removal with SegMIM Pretraining