- LabPlot é um software gratuito que oferece diversos recursos de visualização de dados e análise
- Compatível com vários formatos de dados, como CSV, SQL, Excel (xlsx) e JSON, facilitando a importação de dados
- Com o LabPlot, é possível realizar análise científica e visualização em um só lugar
- Com suporte multiplataforma, pode ser usado em diversos sistemas operacionais, como Windows, macOS e Linux
- Por ser baseado em código aberto, qualquer pessoa pode expandir e personalizar livremente
Introdução ao LabPlot
- O LabPlot é uma ferramenta de visualização e análise de dados gratuita e de código aberto que funciona em várias plataformas
- Os usuários podem realizar com eficiência tarefas de plotagem científica e análise de dados em um único aplicativo
Importação de dados e compatibilidade
- O primeiro passo no LabPlot é a importação de dados em diversos formatos
- Entre os formatos compatíveis estão CSV, Origin, SAS, Stata, SPSS, MATLAB, SQL, JSON, binário, OpenDocument Spreadsheet (ods), Excel (xlsx), HDF5, MQTT, Binary Logging Format (BLF), FITS e muitos outros
- Esse suporte a formatos traz a vantagem de acelerar a integração de dados e o trabalho inicial
Resumo
- O LabPlot é uma ferramenta multiplataforma de visualização e análise de dados científicos que ajuda os usuários a importar rapidamente diversos formatos de dados e trabalhar com eles de forma eficiente
- Como é de código aberto, os usuários também têm a vantagem de poder fazer expansões de funcionalidades e personalizações por conta própria
1 comentários
Comentários do Hacker News
É curioso como ferramentas de gráficos e charts agora são tratadas como um item totalmente comum e comoditizado; quando desenvolvi o Deltagraph pela primeira vez no fim de 1988, ele era voltado para saída em Postscript e Illustrator, trazia uma variedade enorme de gráficos e opções e acabou sendo usado mundialmente quase como um padrão, especialmente para impressão; em meados dos anos 90 eu fiquei só no desenvolvimento e ele foi vendido para uma editora, depois disso mudou de mãos várias vezes ao longo de 25 anos até a pandemia, sempre continuando em cima do código-fonte original escrito em C; nem quero imaginar a bagunça que esse código deve estar hoje
Usei SciDavis por muito tempo e antes também tentei o QtiPlot; quando tive oportunidade, usei o Origin. O SciDavis era meio tosco e travava com frequência, mas para o que eu queria fazer não era um grande problema. Sofri um pouco para configurar o estilo dos gráficos, e copiar estilos era incômodo. Recentemente testei o LabPlot e houve um problema em que ele não reconhecia corretamente formatos de data e séries temporais quando o arquivo csv continha dados datetime, mesmo com opções avançadas e configuração manual. O site de documentação é uma coletânea de vídeos no YouTube, e eu realmente não gosto de ter que procurar manual em vídeo; os desenvolvedores precisam fazer documentação tradicional também. Existe também o AlphaPlot, um fork do SciDavis, mas ele ainda tem seus próprios problemas, como a questão de datas
yyyy-MM-dd hh:mm:ss.zzz. Ainda assim, é uma ferramenta utilizável. Quando quero processamento em lote, geração automática de vários gráficos e reprodutibilidade, uso gnuplot. A curva de aprendizado é íngreme, mas depois de escrever alguns scripts dá para criar seus próprios templates, e isso é útil. É sempre bom ver mais opções surgindo nessa área por causa do movimento open source.Link para o manual do LabPlot
Ferramentas como ggplot dão bastante trabalho quando você quer ajustes finos, mas em compensação a flexibilidade é excelente. Só que, por exemplo, quando tento fazer um spaghetti plot com medições repetidas por participante em dados de estudo longitudinal acelerado, ou um plot de efeitos fixos, a maioria das soluções começa a bater no limite. Para referência, tenho um exemplo de plot que eu fiz.
Exemplo de plot
Parece muito legal, mas eu gostaria que houvesse uma seção explicando “por que isso é melhor do que matplotlib ou outras ferramentas populares de gráficos”. Vi a lista de recursos, mas dá trabalho montar mentalmente uma tabela comparativa. Parece haver vários pontos atraentes, mas eu realmente gostaria de ver algo como estudos de caso para entender se vale a pena investir tempo para aprender essa ferramenta
Está claro que houve muito esforço aqui, mas se você já integra seu código de laboratório com Julia, Matlab, R, Python, Excel etc., fico confuso sobre qual seria a motivação para usar essa ferramenta. Fico curioso se ela é popular em alguma comunidade específica
Provavelmente a ideia é substituir em modo FOSS o papel de uma ferramenta comercial popular em certas comunidades científicas, como o Origin. Ela é útil quando outro software (por exemplo, software de instrumentação) já gerou os dados e você quer visualizá-los rapidamente em plots e fazer um ajuste simples de curvas via GUI. Se você já está acostumado a processar dados com as linguagens e bibliotecas mencionadas, não há muito motivo para precisar dessa ferramenta
Acho que eu sou exatamente o usuário-alvo dessa ferramenta. Fico alternando entre R, Python, Maxima e MATLAB/Octave, normalmente passando os dados em CSV, e é incômodo porque cada ferramenta tem sua própria interface. Também não gosto muito de Jupyter, então, se isso for mais confortável, talvez eu até possa usar como substituto do Jupyter
Pela minha experiência, há bastante gente para quem programar não é produtivo nem confortável. Eu uso Python principalmente, mas na empresa também há muitas licenças de JMP e a maioria dos engenheiros fica satisfeita com o Excel. Só que eu não mostro para os outros quanto tempo levo para fazer meu trabalho. E essas pessoas ainda têm receio de programas open source ou sem reputação. Uma ferramenta assim pode ser uma opção que a pessoa testa sozinha e só depois, quando perceber que é boa o bastante, comenta com o chefe: “isso aqui dá para usar”
Para dar um exemplo real de campo: trabalhei como engenheiro de projeto em veículos de lançamento, e a cada teste e voo acumulávamos frames de dados de telemetria em arquivos enormes, como CSV ou TSV. Era preciso percorrer rapidamente, de forma visual, gráficos de séries temporais com centenas de variáveis para encontrar anomalias na hora, e também ampliar e mover a visualização várias vezes para capturar o que interessava e colocar em documentos. Às vezes era necessário dar zoom até um nível extremamente detalhado, ponto por ponto, bit por bit, amostra por amostra, para capturar casos excepcionais; como ninguém sabia de antemão quando e onde o evento apareceria, velocidade era tudo. Também precisávamos abrir ao mesmo tempo plots de várias variáveis com unidades diferentes para observar correlações, e em análises em equipe frequentemente era necessário visualizar dados na hora. Também eram necessárias análises de frequência ou estatísticas (
periodogram, log/semilog, PDF etc.). Eu queria adicionar rapidamente marcadores e anotações aos plots, mudar rótulos e formatação em WYSIWYG, e aplicar FFT ou filtros e já visualizar o resultado com um único menu. Fazer tudo isso manipulando texto manualmente em Python/Jupyter era ineficiente demais em termos de tempo para esse fluxo de trabalho. No LabPlot ou no aplicativo que usávamos, esse tipo de tarefa podia ser feito quase em tempo real. O Excel até chega perto em alguns aspectos por causa da interface de planilha, mas, quando você precisa definir célula por célula, eixo por eixo, gráfico por gráfico, expansão do plot, formato de rótulo etc. para montar um gráfico de série temporal, você acaba passando o mês inteiro só analisando. Esses aplicativos permitiam trabalhar rápido porque comentários, metadados etc. eram inseridos nos arquivos de dados como anotações formatadas, e arquivos muito grandes eram bufferizados no nível de disco e memória para dar resposta imediata. Para fluxos de trabalho tão específicos, LabPlot ou ferramentas semelhantes são realmente essenciaisAinda não usei essa ferramenta, mas, se ela permitir visualizar dados por drag-and-drop, parece que pode ser um complemento excelente às ferramentas existentes
Acho que este é o Github do projeto
Github do projeto
Repositório oficial de desenvolvimento no KDE GitLab
Queria saber se isso está sofrendo um HN hug of death
Seria muito útil se adicionassem suporte a buckets S3 e outros storages de objetos em nuvem; suporte a Iceberg também seria ótimo, já que está em alta hoje em dia
É uma pena que o banco de dados suportado atualmente seja só SQLite; eu queria conectar direto a um banco de dados ou a uma REST API, mas o processo de exportar para arquivo e depois importar de novo é incômodo demais
O manual do LabPlot menciona suporte a vários bancos de dados
Manual de integração SQL do LabPlot
Lista de drivers de banco de dados do Qt5.15
Talvez você esteja falando de outra coisa?
SQLite é bom o suficiente, e também existem soluções REST de terceiros, então não me parece um grande problema
Estou me perguntando se a posição disso seria algo como uma versão desktop do Metabase ou do Superset?