diff --git a/S10_Polli.ipynb b/S10_Polli.ipynb new file mode 100644 index 0000000..f2b0fb9 --- /dev/null +++ b/S10_Polli.ipynb @@ -0,0 +1,371 @@ +{ + "nbformat": 4, + "nbformat_minor": 0, + "metadata": { + "colab": { + "provenance": [], + "authorship_tag": "ABX9TyNXsdaCx4xSJljmt3Zrmf0k", + "include_colab_link": true + }, + "kernelspec": { + "name": "python3", + "display_name": "Python 3" + }, + "language_info": { + "name": "python" + } + }, + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "id": "view-in-github", + "colab_type": "text" + }, + "source": [ + "\"Open" + ] + }, + { + "cell_type": "markdown", + "source": [ + "####Exercício 1:\n", + "Um nutricionista quer testar se a ingestão diária média de calorias de um grupo de 30 pessoas é diferente de 2000 calorias. Os dados das calorias ingeridas são fornecidos abaixo. Realize o teste de hipóteses usando um nível de significância de 0,05.\n", + "\n", + "Dados: [1900, 2100, 2050, 1980, 1950, 2100, 2000, 2150, 2200, 1850, 1990, 1950, 2050, 2080, 2100, 1900, 1950, 2050, 2150, 2000, 2200, 1900, 2100, 2000, 2150, 1850, 1990, 1950, 2050, 2080]\n", + "\n" + ], + "metadata": { + "id": "20SbS7cMH9yR" + } + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "snUPLnZSH4qw", + "outputId": "eb66a08d-c8e5-43e8-f783-9ac09e2c9b2d" + }, + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + "Estatística t é 1.440678442696004\n", + "Valor p é 0.16038600691798435\n" + ] + } + ], + "source": [ + "\n", + "# h0: A ingestão média diária é igual a 2000 calorias.\n", + "# h1: A ingestão média diária é diferente de 2000 calorias.\n", + "\n", + "# Nível de confiança = '95%'\n", + "# Nível de significância = '5%'\n", + "'''\n", + "Test t: Aplicado quando o desvio padrão populacional não é conhecido e, assim, é\n", + "utilizado o desvio padrão amostral.\n", + "Função: ttest_1samp(): Para comparar a média de uma amostra com um valor de referência.\n", + "parâmetros empregados: amostra, valor de referência.\n", + "\n", + "ttest_1samp(amostra, valor de referência)\n", + "'''\n", + "#importar\n", + "from scipy.stats import ttest_1samp\n", + "#dados\n", + "calorias = [1900, 2100, 2050, 1980, 1950, 2100, 2000, 2150, 2200, 1850,\n", + " 1990, 1950, 2050, 2080, 2100, 1900, 1950, 2050, 2150, 2000,\n", + " 2200, 1900, 2100, 2000, 2150, 1850, 1990, 1950, 2050, 2080]\n", + "\n", + "t_estatistico, p_valor = ttest_1samp(calorias, 2000)\n", + "\n", + "print(f\"Estatística t é {t_estatistico}\")\n", + "print(f\"Valor p é {p_valor}\")\n", + "\n" + ] + }, + { + "cell_type": "markdown", + "source": [ + "#####Resposta\n", + "O valor p (0.1603) é maior que o nível de significância estabelecido de 0.05. Ouseja, a partir dessa amostra, não há evidência suficiente para rejeitar a hipótese nula e concluir que a média da população é diferente de 2000 calorias." + ], + "metadata": { + "id": "R0KrV5YfX55Q" + } + }, + { + "cell_type": "markdown", + "source": [ + "####Exercício 2:\n", + "Um pesquisador deseja verificar se há uma diferença significativa entre as notas de alunos de duas turmas diferentes após um novo método de ensino. As notas das duas turmas são:\n", + "\n", + "Turma A: [85, 78, 90, 88, 76, 95, 89, 84] Turma B: [82, 75, 85, 80, 79, 88, 83, 77]\n", + "\n", + "Realize o teste de hipóteses para comparar as médias das duas turmas usando um nível de significância de 0,05.\n", + "\n" + ], + "metadata": { + "id": "zEsIwPHAILZb" + } + }, + { + "cell_type": "code", + "source": [ + "\n", + "# h0: As notas das Turmas A e B são iguais.\n", + "# h1: As notas das Turmas A e B são diferentes.\n", + "\n", + "# Nível de confiança = '95%'\n", + "# Nível de significância = '5%'\n", + "'''\n", + "Função: ttest_ind(): Para comparar as médias de duas amostras independentes.\n", + "parâmetros empregados: amostra1, amostra2.\n", + "'''\n", + "#importar\n", + "from scipy.stats import ttest_ind\n", + "\n", + "#dados\n", + "turmaA = [85, 78, 90, 88, 76, 95, 89, 84]\n", + "turmaB = [82, 75, 85, 80, 79, 88, 83, 77]\n", + "\n", + "test_ind, p_valor = ttest_ind(turmaA, turmaB)\n", + "\n", + "print(f\"Estatística t é {test_ind}\")\n", + "print(f\"Valor p é {p_valor}\")\n", + "\n" + ], + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "CoM2vdaXVa5p", + "outputId": "9824bba3-38a9-4f29-8389-bdb9752e38f4" + }, + "execution_count": null, + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + "Estatística t é 1.6738367490980877\n", + "Valor p é 0.11634870792349129\n" + ] + } + ] + }, + { + "cell_type": "markdown", + "source": [ + "#####Resposta\n", + "O valor p (0.116) é maior que o nível de significância estabelecido de 0.05. Ou seja, não há evidências suficiente para rejeitar a hipótese nula. Logo as notas das Turmas A e B não apresentam diferença significativa." + ], + "metadata": { + "id": "xQ4nb7tod9uT" + } + }, + { + "cell_type": "markdown", + "source": [ + "####Exercício 3:\n", + "Uma empresa testou a eficácia de um novo software em dois períodos de tempo. Os tempos (em minutos) para concluir uma tarefa antes e depois do uso do software são registrados abaixo. Determine se houve uma melhoria significativa no tempo de conclusão da tarefa.\n", + "\n", + "Antes: [30, 28, 35, 33, 40, 29, 32, 36] Depois: [25, 22, 30, 28, 35, 27, 30, 31]\n", + "\n" + ], + "metadata": { + "id": "6o_sbZk0VY5E" + } + }, + { + "cell_type": "code", + "source": [ + "# h0: tempo médio da execução da tarefa antes e depois do software é igual.\n", + "# h1: tempo médio da execução da tarefa antes e depois do software não é igual.\n", + "\n", + "# Nível de confiança = '95%'\n", + "# Nível de significância = '5%'\n", + "'''\n", + "Função: ttest_rel(): Para comparar as médias de duas amostras dependentes (pareadas).\n", + "parâmetros empregados: antes, adepois.\n", + "'''\n", + "#importar\n", + "from scipy.stats import ttest_rel\n", + "\n", + "#dados\n", + "antes = [30, 28, 35, 33, 40, 29, 32, 36]\n", + "depois = [25, 22, 30, 28, 35, 27, 30, 31]\n", + "\n", + "test_rel, p_valor = ttest_rel(antes, depois)\n", + "\n", + "print(f\"Estatística t é {test_rel}\")\n", + "print(f\"Valor p é {p_valor}\")\n" + ], + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "zSe7SaIifbzi", + "outputId": "a0083bf9-8406-47e4-9837-09dcdea84f91" + }, + "execution_count": null, + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + "Estatística t é 8.217036268592837\n", + "Valor p é 7.679851175528595e-05\n" + ] + } + ] + }, + { + "cell_type": "markdown", + "source": [ + "#####Resposta\n", + "\n", + "O valor p (7.679851175528595e-05) é uma notação científica, logo menor que o nível de significância estabelecido de 0.05. Sendo assim, há evidências suficiente para rejeitar a hipótese nula. O tempo médio da execução da tarefa antes e depois do software não é igual." + ], + "metadata": { + "id": "28Z7V-9jfTUn" + } + }, + { + "cell_type": "markdown", + "source": [ + "####Exercício 4:\n", + "Uma pesquisa foi realizada para verificar a preferência de 100 pessoas por dois tipos de bebidas, A e B, em duas cidades diferentes, X e Y. A tabela de contingência a seguir mostra os resultados:\n", + "\n", + "![image.png]()\n", + "\n", + "Verifique se há uma relação significativa entre a cidade e a preferência pela bebida.\n", + "\n" + ], + "metadata": { + "id": "bGK7xgUifMFx" + } + }, + { + "cell_type": "code", + "source": [ + "'''\n", + "Função: chi2_contingency(): Para testar a independência entre duas variáveis categóricas.\n", + "'''\n", + "#importar\n", + "import numpy as np\n", + "from scipy.stats import chi2_contingency\n", + "# teste de hipotese\n", + "# H0: Não há preferências pelas bebidas\n", + "# H1: Há preferências\n", + "\n", + "# dados\n", + "dados = [[30, 40],[20, 10]]\n", + "\n", + "\n", + "\n", + "# Teste\n", + "estatistica, p_valor, grau_de_liberdade, matriz_frequencia = chi2_contingency(dados)\n", + "\n", + "print(f\"A Estatistica é {estatistica}\")\n", + "print(f\"Valor p é {p_valor}\")\n" + ], + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "pCVrSHGX4nmA", + "outputId": "e722d7ef-91ac-48db-c991-843aba22d9f9" + }, + "execution_count": null, + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + "A Estatistica é 3.857142857142857\n", + "Valor p é 0.04953461343562649\n" + ] + } + ] + }, + { + "cell_type": "markdown", + "source": [ + "##### Resposta\n", + "\n", + "O valor p (0,0495) é menor que o nível de significância estabelecido de 0.05. Sendo assim, há evidências para rejeitar a hipótese nula. Afirmando que há preferencia entre as bebidas." + ], + "metadata": { + "id": "62zh3u0-ABPm" + } + }, + { + "cell_type": "markdown", + "source": [ + "####Exercício 5:\n", + "Um pesquisador deseja testar se três diferentes tipos de fertilizantes têm um efeito significativo no crescimento de plantas. Os crescimentos das plantas (em cm) para cada fertilizante são dados abaixo:\n", + "\n", + "Fertilizante A: [20, 22, 19, 21, 20] Fertilizante B: [18, 20, 17, 19, 18] Fertilizante C: [25, 27, 26, 28, 26] Realize uma ANOVA de uma via para verificar se há uma diferença significativa entre os grupos.\n" + ], + "metadata": { + "id": "aiB2Izj34lSg" + } + }, + { + "cell_type": "code", + "source": [ + "#importar\n", + "from scipy.stats import f_oneway\n", + "\n", + "#Dados\n", + "fertA = [20, 22, 19, 21, 20]\n", + "fertB = [18, 20, 17, 19, 18]\n", + "fertC = [25, 27, 26, 28, 26]\n", + "\n", + "#teste hipoteses\n", + "#H0: O crescimento das plantas são iguais independete do fertilizante\n", + "#H1: Há diferença no crescimento das plantas\n", + "\n", + "# teste\n", + "anova, p_valor = f_oneway(fertA, fertB, fertC)\n", + "\n", + "print(f\"ANOVA:{anova}\")\n", + "print(f\"p valor: {p_valor}\")\n" + ], + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "goUlhTvoA4zU", + "outputId": "b4bdac51-aa94-49eb-8922-3456f217d7ef" + }, + "execution_count": null, + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + "ANOVA:66.66666666666657\n", + "p valor: 3.168809044640198e-07\n" + ] + } + ] + }, + { + "cell_type": "markdown", + "source": [ + "#####Resposta\n", + "\n", + "O valor p (3.168809044640198e-07) é menor que o nível de significância estabelecido de 0.05. Sendo assim, há evidências para rejeitar a hipótese nula. Logo há diferença entre o crescimento das plantas." + ], + "metadata": { + "id": "B9Ya8kR0FZm6" + } + } + ] +} \ No newline at end of file